星云智联发布S1400系列高速互联方案，深度适配 DeepSeek，显著提升AI计算集群通信效率！

6月3日，星云智联宣布在AI智算网络领域实现关键技术突破，正式推出S1400系列AI智算高速互联网卡。作为完全自主研发的国产化解决方案，该产品针对大模型训练与推理场景的严苛需求，以突破性网络性能重新定义智算集群互联标准。目前，产品已成功适配DeepSeek的DeepEP开源通信库，显著提升AI计算集群的通信效率，为AI应用创新注入强劲动力。

S1400系列AI智算高速互联网卡具备1x400G或2x200G的网络接口模式，采用PCIe Gen 5.0 x16接口，提供高达双向100Mpps的RDMA消息速率。其关键特性包括：全面支持RoCEv2协议标准，并兼容NCCL、DeepEP，BCCL等主流集合通信库，确保与现有AI生态的无缝对接。另外，S1400支持先进的GPUDirect技术（GDR、GDA）、用户态MR（UMR）操作，为大规模AI计算集群提供了极致的低延迟和高带宽。尤为突出的是，S1400系列AI智算高速互联网卡自研NBL-SRP协议支持对所有RoCE v2操作（包括Write/Atomic/Send/Read等）的DDP方式的乱序接收和选择性重传，并针对GPU侧Atomic操作和低延迟Local read进行了特别优化，这些特性进一步弥补了国内生态在此方面的不足。S1400系列AI智算高速互联网卡大幅优化了数据处理流程，显著提升了AI智算场景下的互联效率。

在拥塞控制方面，S1400系列搭载了星云智联自研的NBL-CC算法。该算法基于RTT探测与丢包统计进行主动的端到端拥塞控制，不依赖交换机特定配置，具有参数少、部署便捷、性能优异的特点，能实现快速启动、快速收敛，并保持交换机低队列深度与高吞吐量。实际测试数据显示，NBL-CC相较于传统的DCQCN算法，在平均性能上提升50%，99分位性能提升48%，尤其在短流场景下提升幅度高达60%-100%，有效保障了网络的低队列拥塞和持续高吞吐。配合自研的NBL-SRP协议（逐包多路径、DDP乱序接收、选择性重传、快速重传），S1400系列AI智算高速互联网卡在AI主流场景及有损网络下都能够充分发挥接口带宽潜力，其NCCL通信性能在多个关键指标上展现出持平并且部分超越业界标杆产品，并在特定业务场景时延测试中表现出与国际顶尖产品相媲美的168us优异数据（GDR write 7M + atomic），展现了强大的市场竞争力。

在全球科技竞争加剧的背景下，星云智联S1400系列产品的发布不仅是国产高端网络技术的突破，更展现了中国企业在AI基础设施领域的自主创新能力。通过持续攻克自研芯片与算法关键技术，S1400系列产品的发布标志着我国在AI基础设施领域已具备与国际领先水平同台竞技的实力，为构建自主可控的AI产业生态链提供了关键网络支撑。星云智联将坚定不移地加大研发投入，推动国产AI算力网络的技术进步，助力客户把握人工智能时代的战略机遇，决胜未来。