首页 手机网 财经号下载
入驻财经号 登录 客服 |
首页> 财经> 正文

阿里发布最强开源模型,成本仅DeepSeek三分之一该咋看?

财经号APP
江瀚视野江瀚视野 2025-04-29 15:42:26 1074
分享到:

  

  首先,从技术创新角度来看,Qwen3是国内首个“混合推理模型”,将“快思考”与“慢思考”集成进同一个模型,这种创新设计不仅在热门模型中较为少见,而且大大节省了算力消耗。把顶尖的推理模型和非推理模型集成到一个模型里,需要精细、创新的设计及训练,其训练难度远超单纯的推理模型,体现了阿里在技术研发上的深厚实力和创新能力。这一技术创新为模型带来了独特的优势,使其在性能大幅提升的同时,成本得以有效控制。

  其次,从性能表现角度分析,在性能方面,Qwen3采用混合专家架构,总参数量235B,激活仅需22B,预训练数据量达36T ,并经过多轮强化学习。在多个重要测评中表现出色,如在奥数水平的AIME25测评、考察代码能力的LiveCodeBench评测以及评估模型人类偏好对齐的ArenaHard测评等,都超越了众多顶尖模型,充分证明了其卓越的性能。

  第三,从商业价值和市场影响角度考量,Qwen3提供了丰富的模型版本,每款模型均斩获同尺寸开源模型SOTA(最佳性能),能够满足不同用户的多样化需求。其部署成本大幅下降,仅需4张H20即可部署满血版,显存占用仅为性能相近模型的三分之一,这将吸引更多企业和开发者采用。

  最后,从行业竞争角度来看,目前阿里通义已开源200余个模型,全球下载量超3亿次,千问衍生模型数超10万个,已超越美国Llama成为全球第一开源模型。Qwen3的发布将进一步增强阿里在开源模型市场的竞争力,对其他竞争对手形成巨大压力。它的高性能、低成本优势可能会促使行业内其他企业加大研发投入,推动整个行业的技术进步和创新发展。

  

财经号声明: 本文由入驻中金在线财经号平台的作者撰写,观点仅代表作者本人,不代表中金在线立场。仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。同时提醒网友提高风险意识,请勿私下汇款给自媒体作者,避免造成金钱损失,风险自负。如有文章和图片作品版权及其他问题,请联系本站。

0条评论 网友评论文明上网,理性发言

中金登录 微博登录 QQ登录

    查看更多评论

    举报此人

    X
    确认
    取消

    热门视频换一批

    温馨提示

    由于您的浏览器非微信客户端浏览器,无法继续支付,如需支付,请于微信中打开链接付款。(点击复制--打开微信--选择”自己“或”文件传输助手“--粘贴链接--打开后付款)

    或关注微信公众号<中金在线>底部菜单”名博看市“,搜索您要的作者名称或文章名称。给您带来的不便尽请谅解!感谢您的支持!

    复制链接

    鲜花打赏 X

    可用金币:0

    总支付金额:0

    您还需要支付0
    我已阅读《增值服务协议》
    确认打赏

    1鲜花=0.1元人民币=1金币    打赏无悔,概不退款

    举报文章问题 X
    参考地址

    其他问题,我要吐槽

    确定

    温馨提示

    前往财经号APP听深入解析

    取消 确认