国诚投顾:架构创新突破大模型推理延迟瓶颈
行业要闻:
LPU为新一代面向大模型推理阶段的芯片,核心为TSP架构:LPU是专为顺序处理的计算密集型任务设计的新型芯片架构,核心在于TSP架构,包含五大功能模块,将经典的处理器五级流水线拆散在整个芯片内,进而消除了硬件的复杂性,使指令执行顺序和时间具有确定性。在TSP架构下,编译器可以直接访问并精确控制芯片的底层硬件状态,实现了软件定义硬件。
LPU可缩短大模型推理过程中的延迟,提高用户体验感:大模型在推理过程中会存在延迟,延迟与用户体验感精密挂钩,大模型推理过程中的延迟主要在Decode阶段,核心瓶颈在于内存带宽。LPU具备更快的内存带宽,可缩短大模型推理过程中的延迟。同时,基于LPU的大模型不仅具有更快的推理速度,还可以提供更具性价比的价格,可进一步提高用户体验感。
LPU具备广阔的潜在发展空间,已步入量产初期:目前Tokens的消耗量大幅增长,2024年初我国日均Token的消耗量为1000亿,2026年2月主流大模型合计日均Token消耗已到180万亿级别,Tokens消耗量快速增长,带动推理芯片市场规模的高增长。LPU可降低大模型推理的延迟,我们认为LPU有望在推理芯片市场中逐步渗透,具有高成长性的市场空间。目前LPU已步入量产初期,放量在即。
投资观点:
LPU 作为一款新的面向大模型推理阶段的定制芯片,采用 TSP 架构实现了确定性的指令执行顺序和时间,可缩短大模型推理过程中的延迟,提高用户使用体验感。目前推理 Tokens 消耗量大幅增长,中国整体日均 Token 消耗于 2025 年中突破 30 万亿,2026 年 2 月主流大模型合计日均 Token 消耗已到 180 万亿级别,增长 6 倍,所需的推理芯片市场规模持续高增长,LPU 潜在替代空间巨大,同时我们认为 LPU 受益于低推理延时的优异表现,有望实现快速渗透,我们看好LPU 逐渐渗透过程中带来的高成长性以及 LPU 以系统架构出货形式时所带来的PCB 相关机会。
参考来源:2026-03-16 财通证券 唐佳 LPU专题报告一:架构创新突破大模型推理延迟瓶颈,广阔市场空间有望快速放量
风险警示:本文由投资顾问何威(执业证书编号A1290622100002)编辑整理。市场有风险,投资需谨慎。深圳市国诚投资咨询有限公司是证监会批准的证券投资咨询公司,组织机构代码统一信用码为914403007634715216。本文分享的题材方向和研报,旨在为您梳理选股方向,不构成投资建议,据此操作,风险自担!本文力求所涉信息准确可靠,但并不对其准确性、完整性和及时性做出任何保证,对投资者据此进行投资所造成的一切损失不承担任何责任。

财经号声明: 本文由入驻中金在线财经号平台的作者撰写,观点仅代表作者本人,不代表中金在线立场。仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。同时提醒网友提高风险意识,请勿私下汇款给自媒体作者,避免造成金钱损失,风险自负。如有文章和图片作品版权及其他问题,请联系本站。
