近日,2025开放数据中心委员会(以下简称ODCC)春季全会在扬州召开,中国数字EDA/IP知名企业上海合见工业软件集团有限公司(简称“合见工软”)作为ODCC成员单位亮相大会,合见工软副总裁杨凯作为ODCC网络工作组代表,发布了合见针对智算网络Scale-up课题ETH-X传输层协议(PAXI)的创新设计,该协议设计不仅支持内存语义,还具备低延迟、高带宽和高可靠性的特点,能够支持多达256卡的全互联,支持使用通用以太网交换机组网。同时合见工软还推出了标准的IP和VIP产品,包括:传输层(PAXIIP)、标准200G/400G/800G MAC/PCS/FEC IP,以及一套完整的组网验证方案,为智算芯片的高效互联设计提供了强有力的技术保障。
合见工软副总裁杨凯作为网络工作组代表分享
随着大语言模型规模的持续增长和相关应用的广泛普及,智算芯片对算力的需求呈现指数级增长,进而推动了芯片底层互联技术的迅猛发展。在这一背景下,智算芯片的互联技术在带宽、延迟和互联结构等方面面临着前所未有的挑战。从传统的多卡直连到超节点组网,原有的卡间互联协议已难以应对日益增长的需求。随着高速Serdes技术的成熟,新型互联协议在智算芯片的Scale-Up组网中扮演了至关重要的角色。
NVIDIA使用NVLINK作为GPU Scale UP互联技术,也是其将数百个GPU互联成超级GPU的关键技术。针对超节点互联协议,国内外多家企业和组织提出了多种不同的Scale-Up协议。
该协议方案构建了基于AXI协议和以太网协议的芯片间高速低延迟互联接口;支持原生AXI4/APB3协议接口,提供3个WRR优先级的虚拟通道;采用基于信用的端到端流量控制机制;支持MACL2层重传,并可支持通过以太网交换机的端到端重传;运用基于RS272 FEC数据块的L1层重传机制,同时支持双向延迟测量(往返时延)、可配置的MAC目标地址动态映射;支持PFC(优先级流量控制)/Pause帧流量控制;支持超频工作模式。
通过Scale up提升算力和性能的关键困难之一就是延迟问题,通过ETH-X Scale-Up传输层协议方案可以从三个方面减少互联延迟,进行优化:减少访存次数,降低搬运内存数据的总延迟,减少NOC的压力;降低链路延迟,使用低延迟的FEC(RS272),简化MAC的功能;简化软件操作,使用内存语义的操作,多卡做统一编址可当作一卡管理。
Scale-Up协议的可靠性、完整性、可实现性、生态适配,都需要有效的研发手段和开发方式,相关IP需要在提供给芯片厂商使用的时候就能达到最好的状态。合见工软现可为ETH-X Scale-Up协议提供商业化标准IP,包括:标准传输层IP+标准以太网MAC/PCS/FEC,IP级别的仿真验证环境(VIP),及完整的技术文档。
同时,Scale-Up传输协议复杂度较高,针对芯片设计阶段,协议的可实现性、性能测试方案、组网的功能测试方案等,芯片厂商短时间内很难具备上述能力,阻碍芯片设计企业使用新的Scale-Up传输层。合见工软特此为芯片设计企业提供了成熟的ETH-X Scale-Up协议的组网验证原型平台,使用全速的400G接口对接51.2T交换机,实现多节点ETH-X 传输协议的组网验证。提供开放和易用的框架,快速结合客户的逻辑进行验证,同时提供可扩展的验证规模,支持8节点、16节点、最大到128节点的验证规模。帮助GPU/AI芯片厂商快速完成协议的评估和相关IP的集成,解决新协议验证带来挑战,缩短芯片厂商研发时间,同时提供有效的软硬件协同开发平台,加速软件开发。
以太网超节点互联项目是ODCC网络工作组的关键课题之一。该项目由中国信通院、腾讯联合GPU/CPU芯片、服务器、交换机企业等多家合作伙伴,秉承开放创新原则,加速推进各项先进网络技术在算力中心领域的创新实践与应用落地。(何龚轩)
来源:光明网