首页 手机网
入驻财经号 登录 客服 |
首页> 股票> 正文

阿里千问推出原生视觉-语言模型Qwen3.5-397B-A17B

财经号APP
智通财经智通财经 2026-02-17 09:00:04 1637
分享到:

智通财经APP获悉,2月16日,阿里千问正式发布Qwen3.5,并推出Qwen3.5系列的第一款模型Qwen3.5-397B-A17B 的开放权重版本。作为原生视觉-语言模型,Qwen3.5-397B-A17B在推理、编程、智能体能力与多模态理解等全方位基准评估中表现优异。该模型采用创新的混合架构,将线性注意力(Gated Delta Networks)与稀疏混合专家(MoE)相结合,实现出色的推理效率:总参数量达3970亿,每次前向传播仅激活170亿参数,在保持能力的同时优化速度与成本。将语言与方言支持从119种扩展至201种,为全球用户提供更广泛的可用性与更完善的支持。

据介绍,相对于Qwen3系列模型,Qwen3.5的 Post-training 性能提升主要来自于对各类RL任务和环境的全面扩展。更加强调RL环境的难度与可泛化性,而非针对特定指标或狭隘类别的query进行优化。

Qwen3.5通过异构基础设施实现高效的原生多模态训练:在视觉与语言组件上解耦并行策略,避免统一方案带来的低效。利用稀疏激活实现跨模块计算重叠,在混合文本-图像-视频数据上相比纯文本基线达到近100%的训练吞吐。在此基础上,原生FP8流水线对激活、MoE路由与GEMM运算采用低精度,并通过运行时监控在敏感层保持BF16,实现约50%的激活显存降低与超过10%的加速,并稳定扩展至数万亿 token。

财经号声明: 本文由入驻中金在线财经号平台的作者撰写,观点仅代表作者本人,不代表中金在线立场。仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。同时提醒网友提高风险意识,请勿私下汇款给自媒体作者,避免造成金钱损失,风险自负。如有文章和图片作品版权及其他问题,请联系本站。

0条评论 网友评论文明上网,理性发言

中金登录 微博登录 QQ登录

    查看更多评论

    举报此人

    X
    确认
    取消

    热门视频换一批

    温馨提示

    由于您的浏览器非微信客户端浏览器,无法继续支付,如需支付,请于微信中打开链接付款。(点击复制--打开微信--选择”自己“或”文件传输助手“--粘贴链接--打开后付款)

    或关注微信公众号<中金在线>底部菜单”名博看市“,搜索您要的作者名称或文章名称。给您带来的不便尽请谅解!感谢您的支持!

    复制链接

    鲜花打赏 X

    可用金币:0

    总支付金额:0

    您还需要支付0
    我已阅读《增值服务协议》
    确认打赏

    1鲜花=0.1元人民币=1金币    打赏无悔,概不退款

    举报文章问题 X
    参考地址

    其他问题,我要吐槽

    确定

    温馨提示

    前往财经号APP听深入解析

    取消 确认