首页 手机网 财经号下载
入驻财经号 登录 客服 |
首页> 财经> 正文

智谱落地ZCube,大模型厂商同步押注下一代网络架构

格隆汇·港股那点事格隆汇·港股那点事 2026-05-21 14:48:27 346
分享到:

  格隆汇5月21日|近日,智谱联合驭驯网络、清华大学在GLM-5.1的线上生产推理集群中,成功规模化落地了新一代网络架构ZCube。

  

  随着大模型推理需求爆发,特别是Prefill与Decode阶段分离部署后,集群内的数据传输呈现出高度的动态不对称性。传统网络拓扑会因结构性问题产生难以调优的链路拥塞与热点堆积等问题,成为制约万卡级集群性能释放的瓶颈。

  

  智谱ZCube架构以完全扁平化的GPU互联方式,通过“单轨+多轨”混合接入的扁平化拓扑设计,确保全网任意两张GPU有且仅有一条存在唯一最优路径,从而在架构层面实现了网络流量的理想负载均衡。这一创新被网络领域顶会ACM SIGCOMM 2025评价为“显著改变整个行业对网络的认知方式”。

  

  该架构在不新增或更换任何GPU、服务器,且软件栈与业务代码零改动的前提下,成功将集群推理吞吐提升了15%以上,并将TTFT P99尾时延降低了40.6%。其所需的交换机与光模块硬件成本较传统方案节省了33%。在万卡规模下,仅网络硬件一项即可节省投资约2.1亿至6.4亿元。

  

  几乎在同一时期,OpenAI联合NVIDIA、AMD、Intel、Microsoft、Broadcom等五大巨头发布了MRC协议,并已部署于其最大规模超算集群。两大领先模型厂商同时动作,共同印证了网络已成为超大规模AI基础设施竞争的新战场。

  

财经号声明: 本文由入驻中金在线财经号平台的作者撰写,观点仅代表作者本人,不代表中金在线立场。仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。同时提醒网友提高风险意识,请勿私下汇款给自媒体作者,避免造成金钱损失,风险自负。如有文章和图片作品版权及其他问题,请联系本站。

0条评论 网友评论文明上网,理性发言

中金登录 微博登录 QQ登录

    查看更多评论

    举报此人

    X
    确认
    取消

    热门视频换一批

    温馨提示

    由于您的浏览器非微信客户端浏览器,无法继续支付,如需支付,请于微信中打开链接付款。(点击复制--打开微信--选择”自己“或”文件传输助手“--粘贴链接--打开后付款)

    或关注微信公众号<中金在线>底部菜单”名博看市“,搜索您要的作者名称或文章名称。给您带来的不便尽请谅解!感谢您的支持!

    复制链接

    鲜花打赏 X

    可用金币:0

    总支付金额:0

    您还需要支付0
    我已阅读《增值服务协议》
    确认打赏

    1鲜花=0.1元人民币=1金币    打赏无悔,概不退款

    举报文章问题 X
    参考地址

    其他问题,我要吐槽

    确定

    温馨提示

    前往财经号APP听深入解析

    取消 确认