今天分享的是:ODCC开放数据中心委员会::2025年ETH-X Scale Up 协议测试报告
报告共计:39页
ETH-X Scale Up 协议测试报告核心总结
ODCC发布的《ETH-X Scale Up 协议测试报告》,依据相关协议规范,通过原型验证平台与国内先进交换机组网,对ETH-X协议(PAXI+PRI)的可行性与性能展开全面测试,为其工程优化与部署提供关键参考。
测试背景源于AI模型规模扩展下,计算集群互联性能成为系统效率核心瓶颈。ETH-X协议面向超节点架构,主打高吞吐、低时延特性,可实现GPU高效数据访问,此次测试以RoCEv2协议为基线,重点验证通信时延、吞吐等核心指标。
测试环境由1台51.2T容量、128个400G端口的交换机与4台合见工软主机原型组成,通过400G接口组网,覆盖一对一至多对多通信场景,支持RoCEv2与PAXI+PRI双协议测试。测试范围涵盖组网连通性、转发性能、Direct Access、Direct Copy及MOE通信性能五大类。
关键测试结果显著:组网连通性上,RoCEv2与PAXI协议均实现端到端报文收发与转发,验证了互通性基础;转发性能中,交换机无负载与有负载时转发时延分别为466.5ns、469ns,均低于480ns阈值,结合端侧与光模块时延可满足端到端RTT<2us需求。
Direct Access性能中,PAXI PRI增强在128B、256B、512B场景下报文承载效率分别达81.26%、85.62%、87.97%,均优于RoCEv2;单事务读写响应时延平均约1788ns,满足时延诉求;访存队列有效吞吐随单笔数据量与MAC帧长度增大而提升。
Direct Copy测试中,PAXI PRI增强承载的HBM间数据拷贝吞吐随MAC帧长度增加而增长,且可达RoCEv2基线水平(390.66Gb/s)。MOE通信场景下,PAXI PRI在Dispatch(一对多)、Combine(多对一)模式下的通信完成时间均低于RoCEv2,All-to-All模式下吞吐表现整体优异,仅超大报文场景略逊于基线。
综上,ETH-X协议在转发时延、承载效率、吞吐性能等核心指标上均能满足scale-up网络通信需求,其技术可行性与性能优势得到验证,为后续标准化推进与工程落地提供了量化数据支撑。
以下为报告节选内容