6月3日,星云智联宣布在AI智算网络领域实现关键技术突破,正式推出S1400系列AI智算高速互联网卡。作为完全自主研发的国产化解决方案,该产品针对大模型训练与推理场景的严苛需求,以突破性网络性能重新定义智算集群互联标准。 目前,产品已成功适配DeepSeek的DeepEP开源通信库,显著提升AI计算集群的通信效率,为AI应用创新注入强劲动力。
S1400系列AI智算高速互联网卡具备1x400G或2x200G的网络接口模式,采用PCIe Gen 5.0 x16接口,提供高达双向100Mpps的RDMA消息速率。其关键特性包括:全面支持RoCEv2协议标准,并兼容NCCL、DeepEP,BCCL等主流集合通信库,确保与现有AI生态的无缝对接。另外,S1400支持先进的GPUDirect技术(GDR、GDA)、用户态MR(UMR)操作,为大规模AI计算集群提供了极致的低延迟和高带宽。尤为突出的是,S1400系列AI智算高速互联网卡自研NBL-SRP协议支持对所有RoCE v2操作(包括Write/Atomic/Send/Read等)的DDP方式的乱序接收和选择性重传,并针对GPU侧Atomic操作和低延迟Local read进行了特别优化,这些特性进一步弥补了国内生态在此方面的不足。S1400系列AI智算高速互联网卡大幅优化了数据处理流程,显著提升了AI智算场景下的互联效率。
在拥塞控制方面,S1400系列搭载了星云智联自研的NBL-CC算法。该算法基于RTT探测与丢包统计进行主动的端到端拥塞控制,不依赖交换机特定配置,具有参数少、部署便捷、性能优异的特点,能实现快速启动、快速收敛,并保持交换机低队列深度与高吞吐量。实际测试数据显示,NBL-CC相较于传统的DCQCN算法,在平均性能上提升50%,99分位性能提升48%,尤其在短流场景下提升幅度高达60%-100%,有效保障了网络的低队列拥塞和持续高吞吐。配合自研的NBL-SRP协议(逐包多路径、DDP乱序接收、选择性重传、快速重传),S1400系列AI智算高速互联网卡在AI主流场景及有损网络下都能够充分发挥接口带宽潜力,其NCCL通信性能在多个关键指标上展现出持平并且部分超越业界标杆产品,并在特定业务场景时延测试中表现出与国际顶尖产品相媲美的168us优异数据(GDR write 7M + atomic),展现了强大的市场竞争力。
在全球科技竞争加剧的背景下,星云智联S1400系列产品的发布不仅是国产高端网络技术的突破,更展现了中国企业在AI基础设施领域的自主创新能力。通过持续攻克自研芯片与算法关键技术,S1400系列产品的发布标志着我国在AI基础设施领域已具备与国际领先水平同台竞技的实力,为构建自主可控的AI产业生态链提供了关键网络支撑。 星云智联将坚定不移地加大研发投入,推动国产AI算力网络的技术进步,助力客户把握人工智能时代的战略机遇,决胜未来。