首页 手机网 财经号下载
入驻财经号 登录 客服 |
首页> 股票> 正文

国诚投顾:架构创新突破大模型推理延迟瓶颈

财经号APP
严序刚严序刚 2026-03-16 17:51:33 192
分享到:

  行业要闻:

  LPU为新一代面向大模型推理阶段的芯片,核心为TSP架构:LPU是专为顺序处理的计算密集型任务设计的新型芯片架构,核心在于TSP架构,包含五大功能模块,将经典的处理器五级流水线拆散在整个芯片内,进而消除了硬件的复杂性,使指令执行顺序和时间具有确定性。在TSP架构下,编译器可以直接访问并精确控制芯片的底层硬件状态,实现了软件定义硬件。

  LPU可缩短大模型推理过程中的延迟,提高用户体验感:大模型在推理过程中会存在延迟,延迟与用户体验感精密挂钩,大模型推理过程中的延迟主要在Decode阶段,核心瓶颈在于内存带宽。LPU具备更快的内存带宽,可缩短大模型推理过程中的延迟。同时,基于LPU的大模型不仅具有更快的推理速度,还可以提供更具性价比的价格,可进一步提高用户体验感。

  LPU具备广阔的潜在发展空间,已步入量产初期:目前Tokens的消耗量大幅增长,2024年初我国日均Token的消耗量为1000亿,2026年2月主流大模型合计日均Token消耗已到180万亿级别,Tokens消耗量快速增长,带动推理芯片市场规模的高增长。LPU可降低大模型推理的延迟,我们认为LPU有望在推理芯片市场中逐步渗透,具有高成长性的市场空间。目前LPU已步入量产初期,放量在即。

  投资观点:

  LPU 作为一款新的面向大模型推理阶段的定制芯片,采用 TSP 架构实现了确定性的指令执行顺序和时间,可缩短大模型推理过程中的延迟,提高用户使用体验感。目前推理 Tokens 消耗量大幅增长,中国整体日均 Token 消耗于 2025 年中突破 30 万亿,2026 年 2 月主流大模型合计日均 Token 消耗已到 180 万亿级别,增长 6 倍,所需的推理芯片市场规模持续高增长,LPU 潜在替代空间巨大,同时我们认为 LPU 受益于低推理延时的优异表现,有望实现快速渗透,我们看好LPU 逐渐渗透过程中带来的高成长性以及 LPU 以系统架构出货形式时所带来的PCB 相关机会。

   

   

  参考来源:2026-03-16 财通证券 唐佳 LPU专题报告一:架构创新突破大模型推理延迟瓶颈,广阔市场空间有望快速放量

   

  风险警示:本文由投资顾问何威(执业证书编号A1290622100002)编辑整理。市场有风险,投资需谨慎。深圳市国诚投资咨询有限公司是证监会批准的证券投资咨询公司,组织机构代码统一信用码为914403007634715216。本文分享的题材方向和研报,旨在为您梳理选股方向,不构成投资建议,据此操作,风险自担!本文力求所涉信息准确可靠,但并不对其准确性、完整性和及时性做出任何保证,对投资者据此进行投资所造成的一切损失不承担任何责任。

   

  白底.jpg

财经号声明: 本文由入驻中金在线财经号平台的作者撰写,观点仅代表作者本人,不代表中金在线立场。仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。同时提醒网友提高风险意识,请勿私下汇款给自媒体作者,避免造成金钱损失,风险自负。如有文章和图片作品版权及其他问题,请联系本站。

0条评论 网友评论文明上网,理性发言

中金登录 微博登录 QQ登录

    查看更多评论

    举报此人

    X
    确认
    取消

    热门视频换一批

    温馨提示

    由于您的浏览器非微信客户端浏览器,无法继续支付,如需支付,请于微信中打开链接付款。(点击复制--打开微信--选择”自己“或”文件传输助手“--粘贴链接--打开后付款)

    或关注微信公众号<中金在线>底部菜单”名博看市“,搜索您要的作者名称或文章名称。给您带来的不便尽请谅解!感谢您的支持!

    复制链接

    鲜花打赏 X

    可用金币:0

    总支付金额:0

    您还需要支付0
    我已阅读《增值服务协议》
    确认打赏

    1鲜花=0.1元人民币=1金币    打赏无悔,概不退款

    举报文章问题 X
    参考地址

    其他问题,我要吐槽

    确定

    温馨提示

    前往财经号APP听深入解析

    取消 确认