首页 手机网
入驻财经号 登录 客服 |
首页> 财经> 正文

词元驱动AI推理侧爆发 国产芯片迎替代黄金窗口

财经号APP
金证研金证研 2026-04-03 22:27:20 321
分享到:

  在近期举办的GTC 2026大会上,相关行业观点引发了市场深思。AI产业的重心正在从“训练模型”向“推理应用”转移,未来每一秒钟、每一次交互,背后都是海量Token的生成与消耗。而近期中国发展高层论坛2026年年会上,国家数据局为Token正式定名——“词元”,并明确相关定位:“词元”不仅是智能时代的价值锚点,更是连接技术供给与商业需求的“结算单位”。中国日均词元调用量在2026年3月已突破140万亿,本年度三个月时间又增长40%以上。

  词元产业的应用与发展趋势,或决定了近期半导体周期的发展态势。当市场的焦点还停留在英伟达新一代GPU的市场表现与行业格局时,一个深刻的变化正在发生:推理侧的需求,正以远超训练侧的速度膨胀。这一变化,不仅重塑了AI算力的结构,也有望为中国半导体产业链及科创50相关领域,带来了相应的发展空间。

  过去两年,AI算力的核心驱动力是“训练”——巨头们比拼的是谁能用最多的芯片、最快的速度,训练出参数更大的模型。这种模式对芯片的要求近乎苛刻:最先进的制程、最高的单卡算力、CUDA生态应用较为广泛等,英伟达在该阶段占据较高市场应用份额。

  但当AI进入应用爆发期,逻辑发生了根本转变。推理,这个将模型能力转化为实际服务的过程,开始占据算力消耗的主导地位。与训练不同,推理场景追求的是“综合成本最低”与“能效比最优”。在一个AI客服、视频平台等规模化的应用场景中,采用高成本的高端GPU开展全部推理任务,经济性与实用性相对有限。这为国产算力提供了重要方向,推理侧的芯片需求呈现出了分层的特征:在金融高频交易、自动驾驶决策等高端场景,对芯片性能要求较高;但在占据绝对多数份额的海量推理场景——比如互联网搜索、内容生成、企业级应用——核心诉求已转变为“够用、便宜、稳定”。而这恰恰是国产芯片通过架构创新(如ASIC、LPU)和成本优化具备发展潜力的领域。

  更重要的是,国产芯片的“可用性”正在逐步被验证。众多国产算力厂商产品在FP8算力等关键指标上不断优化提升,且在算力生态上正加速适配国产大模型。当推理需求开始放量,下游应用厂商为了控制成本和保障供应链稳定,倾向于采用性价比更优的国产方案。

  

财经号声明: 本文由入驻中金在线财经号平台的作者撰写,观点仅代表作者本人,不代表中金在线立场。仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。同时提醒网友提高风险意识,请勿私下汇款给自媒体作者,避免造成金钱损失,风险自负。如有文章和图片作品版权及其他问题,请联系本站。

0条评论 网友评论文明上网,理性发言

中金登录 微博登录 QQ登录

    查看更多评论

    举报此人

    X
    确认
    取消

    热门视频换一批

    温馨提示

    由于您的浏览器非微信客户端浏览器,无法继续支付,如需支付,请于微信中打开链接付款。(点击复制--打开微信--选择”自己“或”文件传输助手“--粘贴链接--打开后付款)

    或关注微信公众号<中金在线>底部菜单”名博看市“,搜索您要的作者名称或文章名称。给您带来的不便尽请谅解!感谢您的支持!

    复制链接

    鲜花打赏 X

    可用金币:0

    总支付金额:0

    您还需要支付0
    我已阅读《增值服务协议》
    确认打赏

    1鲜花=0.1元人民币=1金币    打赏无悔,概不退款

    举报文章问题 X
    参考地址

    其他问题,我要吐槽

    确定

    温馨提示

    前往财经号APP听深入解析

    取消 确认