智谱发布GLM-5.1高速版API，刷新全球大模型API速度纪录

格隆汇·港股那点事 2026-05-22 10:58:06

分享到：

智谱近日推出GLM-5.1高速版API“GLM-5.1-highspeed”，其模型输出速度达到400 tokens/s，刷新了当前全球大模型厂商API的速度上限。

长期以来，高速模型几乎总是轻量级模型，但GLM-5.1高速版打破了这一行业惯例。它首次在国产大模型中，将旗舰级能力与极致低延迟同时带入生产环境，用户无需再为响应速度牺牲模型质量。

实测显示，在AI编程场景中，写代码仿佛开启了10倍速，模型能够一边理解工程上下文，一边持续生成代码与修改方案；在3D游戏中，玩家控制一个角色在3D地图里移动并输入文字，模型会根据输入的文字瞬时建模，场景实时改变，此前因延迟而无法实现的全新产品形态，开始真正具备落地可能；在交互界面上，在用户提出需求的那一刻，模型可以即时生成恰好匹配该需求的工具与交互，甚至可以做出意图判断。

实现这一速度的核心是TileRT高性能推理引擎。该引擎由智谱GLM团队与TileRT团队联合打造，在推理引擎、调度系统与底层基础设施三个层面进行了系统级优化。其设计思路是彻底抛弃Runtime层的动态调度，在编译期（AOT）将整个计算图静态编排为一个常驻GPU的persistent Engine Kernel。

目前，GLM-5.1高速版适用于AI编程、实时交互、商业决策、实时语音等速度敏感场景，并通过智谱MaaS平台向部分企业客户开放。

分享收藏举报

财经号声明：本文由入驻中金在线财经号平台的作者撰写，观点仅代表作者本人，不代表中金在线立场。仅供读者参考，并不构成投资建议。投资者据此操作，风险自担。同时提醒网友提高风险意识，请勿私下汇款给自媒体作者，避免造成金钱损失，风险自负。如有文章和图片作品版权及其他问题，请联系本站。

0条评论网友评论文明上网，理性发言

查看更多评论

举报此人

友情链接

温馨提示

由于您的浏览器非微信客户端浏览器，无法继续支付，如需支付，请于微信中打开链接付款。（点击复制--打开微信--选择”自己“或”文件传输助手“--粘贴链接--打开后付款）

或关注微信公众号<中金在线>底部菜单”名博看市“，搜索您要的作者名称或文章名称。给您带来的不便尽请谅解！感谢您的支持！

复制链接

鲜花打赏 X

18朵 58朵 188朵 588朵 1888朵

可用金币：0个

总支付金额：0元

您还需要支付0元

我已阅读《增值服务协议》

确认打赏

1鲜花=0.1元人民币=1金币打赏无悔，概不退款

智谱发布GLM-5.1高速版API，刷新全球大模型API速度纪录

0条评论网友评论文明上网，理性发言

举报此人

格隆汇·港股那点事

推荐财经号换一批

热门视频换一批

友情链接

温馨提示

鲜花打赏 X

温馨提示

智谱发布GLM-5.1高速版API，刷新全球大模型API速度纪录

0条评论 网友评论文明上网，理性发言

举报此人

格隆汇·港股那点事

推荐财经号 换一批

热门视频换一批

友情链接

温馨提示

鲜花打赏 X

温馨提示

0条评论网友评论文明上网，理性发言

推荐财经号换一批