行业: 全行业
技术: AI
算力作为现代信息社会发展的基石,在人工智能、大数据、区块链、云计算等应用领域都担当着重要角色,它作为信息采集、加工、存储、传递、处理、转换以及表现的基础条件,在我国新基建事业建设当中发挥着重要作用。
近日,飞腾联合宝德和比特大陆共同推出全国产 AI 计算平台解决方案,主要面向人工智能领域,提供多样化算力支撑。该方案采用飞腾高性能服务器处理器,具备高效的硬件级虚拟化功能,完美支持虚拟机和容器化,可通过部署微服务轻松实现各种应用快速搭建。除具备高性能的通用算力外,通过适配搭载比特大陆新一代加速卡实现强大的AI专有算力支撑,可广泛应用在人工智能各领域。同时也因其国产方案特色,必将在新基建中发挥着举足轻重的作用。
该国产高性能AI计算平台由基于飞腾高性能处理器的宝德服务器搭载比特大陆最新深度学习加速卡构成,计算性能业界领先,特别适用于超大运算规模的深度神经网络的推理运算,可实现对诸如视频结构化、人脸识别、物品识别、视频内容增强等等典型的AI运算进行加速。
图1. 国产AI服务器內视图
该全国产高性能AI服务器可实现对多种人工智能算法的加速,例如:其接收采集前端传送的视频流与图片流等信息,利用人工智能算法进行智能分析,进而将分析结果传递给下一环节的应用平台进行处理,以实现基于AI的场景业务应用。
![]() |
图2. 典型方案组网示意图
该国产AI服务器适合用在基于深度学习技术实现的各种AI+行业场景的AI加速推理。包括互联网、智慧警务、智慧交通、智慧城市、智慧社区、智慧零售、工业智能、智慧医疗等等的AI+落地。
飞腾CPU处理器和比特大陆算丰TPU处理器都是自主研发的芯片,具备完整的自主知识产权和后续迭代开发能力,可以对各类项目提供长期安全的最底层硬件资源支撑。
比特大陆推出的SC5+人工智能加速卡是基于BM1684芯片的第三代量产产品,成熟度稳定度更高。该加速卡同时支持FP32和INT8等多种精度计算,SC5+三芯片卡可提供强劲的近100路视频硬解码能力,内存容量可达36GB/48GB,单卡配置96MB高速缓存SRAM,小尺寸模型计算可大幅提速,多项指标在国内同类产品中居首,在同等运算数精度下的计算性能超越国际同类主流产品。比特大陆与宝德高性能AI服务器具备业界领先的高算力密度、高能效比、低功耗等突出特点。
比特大陆工具链经历了多年的技术打磨与沉淀,具备业内领先的完善与成熟度,对开发人员友好易用,可实现快速上手,能很大程度上节省算法迁移工作量和成本。工具链支持包括Caffe、TensorFlow、Pytorch、Mxnet、Darknet、PaddlePaddle在内的业内主流深度学习框架,涵盖了神经网络推理阶段所需的模型优化、高效运行时支持等能力,为深度学习应用开发和部署提供易用、高效的全栈式解决方案。
SC5+加速卡具备视频解码、图像解码、视频编码、图像编码、视频前后处理、AI推理运算加速、数据安全引擎等多个计算加速单元,可以对CV视觉业务的全流程数据加工、计算、压缩/解压缩等进行逐个环节的运算加速增强,减少甚至摆脱对主机计算资源的占用,减少数据搬运次数,提高业务效率,增强整体AI计算服务器的可靠性和鲁棒性。
1.宝德:BD-21083F2高性能机架式服务器
宝德BD-21083F2机架式服务器是宝德计算机基于国产飞腾处理器FT-2000+/64设计开发,同时搭载多张比特大陆SC5+加速卡,整体采用国产自主固件和国产自主Linux操作系统,成为整体方案的高性能、高稳定、高可靠的平台保证。
图3. 宝德BD-21083F2服务器外观
该服务器可支持10个热插拔2.5英寸或3.5英寸SATA/SAS/SSD硬盘三种存储方案。整机结构采用模块化设计方案,主机处理器模块、系统电源模块、系统风扇可快速免工具拆装,具有结构紧凑可靠、便于扩展、便于维护等优点。面向党政和国家重点行业信息系统和业务系统应用需求,具有高吞吐率、单线程能力强、整数计算性能高、访问和IO通道带宽高等特点,能满足相关应用需求,可以用于各种人脸识别、视频结构化、视频转码处理、安防监控、机器视觉,实现对多种CNN/RNN /DNN等神经网络模型的高性能推理运算。
表1.宝德BD-21083F2服务器技术规格
宝德BD-21083F2飞腾AI服务器技术规格一览表 |
|
处理器 |
飞腾FT2000+/64, 64核CPU * 1,工作频率2.2GHz |
内存 |
8个DDR4内存插槽,最大可支持256G |
存储 |
最大支持10个2.5英寸 或3.5英寸SATA/SAS/SSD热插拔硬盘 2个内置2.5英寸SAS/SATA/SSD硬盘 |
显示 |
BMC控制器集成 |
光驱 |
USB DVD光驱 |
PCI/PCIE扩展 |
2 个PCIE3.0 x16 & 2 个PCIE3.0 x4 标准插槽/ 4 个PCIE3.0 x8 & 2 个PCIE3.0 x4 标准插槽 1 个PCIE3.0 x8 非标插槽(支持扩展1 个82599 卡或2 个NVME M.2 SSD) |
网络控制器 |
板载I350 千兆控制器、82599 万兆控制器(需配82599 万兆网卡) |
电源 |
500W 1+1冗余电源 |
110-240V AC,60/50Hz |
|
服务器管理 |
BMC 支持IPMI2.0,KVM |
外部设备接口 |
后面板:1 个VGA 接口、1个串口、2个USB3.0 接口、2个JBOD接口、4个RJ45 千兆网口、1个RJ45 千兆管理网口、2个光纤万兆网口(需配82599 万兆网卡) |
前面板:2个USB2.0接口 |
|
板载 1个PCIE 3.0 x4、支持M.2 硬盘 板载2个MSATA 接口 |
|
操作系统 |
麒麟V10经严格认证 |
AI加速卡与AI推理规格 |
|
规格型号 |
比特大陆SOPHON SC5+ |
典型配置 |
4张SC5+ |
典型配置AI分析性能 |
不少于192路视频流全流程实际AI分析能力,比如人脸识别、视频结构化等 |
典型配置视频解码路数 |
456路 H.264/H.265 1080P@25 fps解码性能 |
TPU 核心架构 |
SOPHON |
单卡AI计算能力 |
FP32(FLOPS): 6.6T INT8(OPS)Winograd OFF: 52.8T INT8(OPS)Winograd ON : 105.6T |
单卡VPU |
视频解码能力:H.264:1080P@2880fps/H.265:1080P@3000fps 视频解码分辨率:CIF/D1/720P/1080P/4K(3840×2160)/8K(8192×4096) 视频编码能力:H.264:1080P @210fps/H.265:1080P @180fps 视频编码分辨率:CIF/D1/720P/1080P/4K(3840×2160) |
单卡JPU |
JPEG图片解码能力:2400张/秒@1080P,最大分辨率支持32768×32768 |
环境及规范 |
|
环境温度 |
运行时10℃至35℃ 非运行时-40℃至+60℃ |
相对湿度 |
运行时10%~90% 非运行时5%~95% |
安全标准 |
3C |
机箱结构 |
|
系统外形 |
2U机架式 |
重量 |
满配置约28Kg |
整机尺寸 |
780mm(长)*430mm(宽)*88mm(高) |
![]() |
在该方案中搭载比特大陆(BITMAIN)推出的最新一代深度学习加速卡SC5+,来实现对多种CNN/RNN /DNN等神经网络模型的计算加速。
2. 比特大陆SC5+加速卡外观
比特大陆SC5+加速卡内置3颗BM1684 TPU处理器,为标准PCIE 3.0接口,采用无风扇设计,可提供高达105.6T INT8算力,以及6.6T FP32算力,可支持高精度计算。其中,BM1684 TPU处理器采用特别优化过的脉动阵列架构,在进行深度学习推理时,具有业界领先的利用率。SC5+ 加速卡可以用于各种人脸识别、视频结构化、安防监控、人工智能、机器视觉,用户可以通过BITMAIN同步提供的工具链软件,实现对多种CNN/RNN /DNN等神经网络模型的计算加速。
表2.比特大陆SC5+加速卡配置
FT-2000+/64
飞腾腾云S2500
宝德科技股份有限公司是业内最早从事自主安全产品研发的厂商,以服务器和PC整机研发、生产、销售和为客户提供云计算综合解决方案为主营业务,致力于成为中国领先的IT产品和解决方案提供商,为政府、互联网、教育、广电、安全、金融、电信、税务、交通、电力、医疗等行业提供尖端的IT产品和服务。多年来,在强者林立的中国服务器市场,凭借先进的技术和独特的软硬件综合实力,宝德服务器市场占有率连续多年稳居国内前五和全球前九。
公司名称:宝德网络安全系统(深圳)有限公司
企业官网:www.powerleader.com.cn
公司电话:4008-870-872
公司地址:深圳市龙华新区观澜高新技术产业园宝德科技研发生产基地(观澜街道环观南路南侧)