中科亿海微与飞腾 RDMA智能网卡联合解决方案

  • Bootstrap 行业: 互联网, 金融, 运营商

  • Bootstrap 技术: 网络

行业痛点:

随着我国人工智能、大数据、工业互联网应用高速发展,数据处理需求迅速增长。IDC数据显示,2025年全球数据总量预计达到175ZB,中国拥有数据量将达到48.6ZB,位居全球第一。在增长速度上,中国数据量和数据中心流量平均增速均快于全球,仍处在快速发展阶段。面对海量数据传输处理压力的不断加大,目前10G、25G网络已经无法满足现代智能计算的需求,100G甚至400G的数据中心网络逐渐成为新一代数字基础设施发展趋势和新一代异构算力互联的主要网络基础设施。

传统的TCP/IP软硬件架构及应用存在着网络传输和数据处理的延迟过大、存在多次数据拷贝和中断处理、复杂的TCP/IP协议处理等问题。RDMA(Remote Direct Memory Access,远程直接内存访问)是一种为了解决网络传输中服务器端数据处理延迟而产生的技术。RDMA将用户应用中的数据直接传入服务器的存储区,通过网络将数据从一个系统快速传输到远程系统的存储器中,消除了传输过程中多次数据复制和文本交换的操作,降低了CPU的负载。

为了应对云计算、人工智能模型训练对高速网络通信的需求,飞腾联合中科亿海微打造智能网卡解决方案。本方案基于FPGA+飞腾CPU的异构计算架构技术,通过逻辑电路的形式实现高性能RDMA功能,从而卸载网络协议栈处理的相关CPU开销,满足网络通信高带宽低延迟的性能要求。通过该方案,可为带宽和延时敏感型应用程序提供高效、高性能的 RDMA服务,特别是在大规模数据传输和分布式计算环境中广泛应用。


方案详情:

系统整体架构分为CPU系统和FPGA系统两个部分,CPU和FPGA通过PCIe标准总线连接。CPU软件驱动系统包括两个子系统:内核态驱动、用户态驱动。内核态驱动是RDMA驱动的核心部分,它直接与硬件进行交互,负责处理底层的数据传输和控制逻辑。该子系统通过与FPGA固件中的RDMA引擎进行通信,实现了Write、Read、Send和Recv等RDMA操作,提供了高性能、低延迟的远程内存访问能力。用户态驱动作为内核态驱动子系统的补充,主要负责与上层应用进行交互,为用户提供了更加友好的使用体验。它通过与内核态驱动子系统进行通信,将用户的应用请求转化为底层的RDMA操作,并将结果返回给用户。用户态驱动子系统还提供了丰富的调试和测试工具,方便用户进行系统的调试和优化。

FPGA系统主要包括以下三个子系统:100GE接口子系统:包括100GE的MAC,数据包的接收和发送,PFC和PAUSE帧的处理,数据包数和字节数的统计,RX方向的CRC校验和TX方向的CRC插入,RSFEC纠错。PCIe接口子系统:一个多队列的PCIE接口,PCIE接口在处理业务报文的同时可以从主机发起的对FPGA各个业务子系统的寄存器访问。RDMA引擎子系统:实现RDMA READ、RDMA WRITE、SEND和RECV等操作。

1 RDMA智能网卡系统架构图


方案实施效果:

以下是在飞腾CPU,使用perftest测试结果:

2  性能测试结果

经过对飞腾腾锐D2000系统的适配,目前智能网卡的内核态驱动和用户态驱动均已经能够实现产品的设计规格,通过对网络配置参数和PCIe接口参数的调优,性能满足绝大部分智算场景高网络吞吐量的需求。

除了能够支持飞腾腾锐D2000处理器,经评估本方案也能够在飞腾腾云S5000C服务器上兼容运行,搭配AI服务器场景实现AI智算中心高速网络连接的需求。


相关产品:

亿海微NF3000-RDMA智能网卡

产品特性

•支持2路100Gb/s以太网接口;支持PCIe3*16;

•支持SRIOV虚拟化技术;

•支持网络硬件卸载技术,包括CheckSum、VXLAN等以太网功能卸载;

•支持融合以太网的 RDMA技术(RoCEv2协议);

•支持socket、CM 建链方式;

•支持RC、UD传输模式;

•支持 Write、Read、Send 和 Recv 操作接口;

•支持PFC、ECN、DCQCN流控机制;

•支持Verbs API / Python Verbs API编程接口;


支持CPU平台:

飞腾腾锐D2000

飞腾腾云S5000C


伙伴信息:

中科亿海微电子科技(苏州)有限公司
http://www.ehiway.cn

中科亿海微电子科技(苏州)有限公司,是中国科学院“可编程逻辑芯片与系统”研究领域的科研与产业化团队,按照国家创新驱动发展战略,发起成立的以“可编程逻辑芯片与可重构系统”为技术特色、以“软件定义硬件”系统设计与集成为主营业务的高新技术企业,公司于2017年1月在苏州注册成立。

 

公司坚持全正向设计技术路线,研制具有高可靠性的嵌入式可编程电路 IP核、可编程逻辑芯片和EDA软件,实现可编程逻辑芯片软硬件的全面自主KK。面向大数据、云计算、人工智能发展需求,提供“端- 网- 云”软件定义硬件的数据加速解决方案和高性能集成电路设计服务,满足工业控制、通信、汽车电子、数据中心等业务领域的应用需要。

 

公司现有员工百余人,其中博士和硕士占比42%,高级专业技术职务人员占比23%,涵盖集成电路硬件设计、软件设计、测试、抗辐照加固、可靠性保障、产品应用推广等方面。公司同时承担研究生培养职能,现有研究生导师多名,微电子学与固体电子学在读博士、硕士研究生数十人。