曦望新获超10亿融资，S3芯片目标百万Token一分钱

财经号APP

不慌实验室 2026-04-22 21:30:12

208

分享到：

4月20日消息，国内全栈自研AI推理GPU企业曦望（Sunrise）宣布完成新一轮超10亿元融资，由杭州资本领投，多家产业方战投、地方国资及头部财务机构共同参与。

严苛标准

这是2026年AI产业全面迈入“推理落地、智能体普及”时代后，国内GPU赛道诞生的最大单笔融资之一。

前身为商汤科技大芯片部门的曦望，自2024年底分拆独立仅一年多，便完成了七轮融资，累计融资额约40亿元，估值突破百亿大关，成为国内首家纯推理GPU独角兽。

本轮资金将主要用于三大方向：新一代启望S3推理GPU的规模化量产交付、全栈软件生态建设，以及S4高性能推理GPU、S5安全可控推理GPU的后续研发迭代。

目前曦望团队规模约400人，研发人员占比超80%，汇聚了来自英伟达、AMD、华为海思、昆仑芯等顶尖企业的核心人才。公司已推进三代推理GPU迭代，数万颗GPU量产落地，实现了从芯片研发、产品量产到解决方案交付的完整闭环，并保持着“芯片均实现一次性流片成功”的严苛标准。

2026年1月，曦望发布旗舰产品启望S3推理GPU，这是国内首款搭载LPDDR6且兼容LPDDR5X内存的推理GPU。它没有盲目照搬高端训练GPU的HBM显存路线，而是基于智能体推理的本质需求，从AI Core计算架构到内存IO系统进行了全链路重构。

以OpenClaw为代表的智能体推理，“感知—规划—执行—反馈”的高频循环带来了对KV-cache密集访问的全新计算负载，而通用GPU面向训练优化，推理实际算力利用率往往远低于峰值。

推理落地

启望S3通过裁剪训练态所需的冗余模块，将节省出的晶体管与功耗预算全部集中投向推理，让单位面积有效算力效率提升5倍以上。

在大语言模型推理中占总计算量90%以上的GEMM与Flash Attention算子，启望S3将其利用率分别推至约99%与98%，原生支持从FP16到FP4的全链路低精度运算，推理性能较上一代S2提升5倍，目标实现Token成本下降90%。

在DeepSeek V3/R1满血版等主流大模型推理场景中，单位Token推理成本较上一代降低约90%，达成了“百万Token一分钱”的工程能力。

曦望的百亿估值，根植于AI产业正在发生的深刻结构性转折，算力的重心正从训练加速转向推理落地。

2026年被行业公认为“AI智能体元年”，德勤与CES 2026市场研究数据显示，2025年推理已占到全部AI算力支出的50%，2026年这一比例跃升至70%以上，是训练算力的4.5倍，全球推理芯片市场规模约1450亿美元。

联想CEO杨元庆判断，AI支出结构将从“80%训练+20%推理”完全翻转为“20%训练+80%推理”；英伟达黄仁勋预计2027年AI推理芯片潜在市场可达1万亿美元。

在中国市场，2026至2030年GPU市场规模预计从2050亿元攀升至5420亿元，推理需求爆发是核心增长引擎。

与此同时，推理算力租赁价格半年涨幅近40%，阿里云、百度云、腾讯等云厂商近期纷纷上调算力产品价格，涨幅达5%至34%。

日趋白热化

这一“算力通胀”背景下，曦望将推理成本下降90%作为核心目标，其意义远不止于企业自身的商业成功。不同于多数国产芯片厂商的“训推一体”路线，曦望从创立之初便坚定All-in推理赛道，以用户真实的Token成本、单位能耗和服务稳定性为芯片设计核心。

产业资本阵容涵盖三一集团、第四范式、美的控股、游族网络等，形成了“芯片从设计第一天起就有了客户”的深度绑定模式，它们不仅是投资者，更是首批核心客户，让曦望能够在实际使用中获得一手反馈，持续优化产品易用性。

曦望已与第四范式推出“百万Token一分钱”推理成本计划，业务触角延伸至政府智算中心、信创、金融、医疗、能源等国家重点领域。

不过，曦望的突围之路并非坦途，行业竞争与生态短板仍是其必须直面的核心考验。在国际巨头层面，英伟达早已重兵布局推理赛道，其新一代Blackwell架构推理性能较H100提升4倍，正加速规模化落地；同时斥资200亿美元拿下Groq技术授权并吸纳核心团队，进一步补强推理算力布局，意图巩固市场主导地位。

国内赛道同样竞争激烈，华为昇腾、寒武纪等头部厂商持续加码推理芯片研发，本土企业间的市场争夺日趋白热化。

而软件生态仍是国产芯片的普遍短板，尽管曦望已实现指令集、GPGPU IP、编译工具链全栈自研，且兼容CUDA与主流AI框架，但在开发者社群积累、场景化应用适配等方面，与英伟达成熟生态仍存在明显差距。

此外，如何稳定获得先进制程产能，满足市场爆发式增长的需求，也是曦望需要解决的关键问题。

市场空间方面，预计2028年前后国产GPU在推理市场的占有率将突破40%，推理侧的巨大增量市场为国产替代提供了前所未有的战略机遇。

曦望已完成S4和S5芯片的技术路线规划，持续加码近存计算、光电共封装等前沿技术探索，200余项核心专利为其后续迭代奠定了技术根基。

手握约40亿累计融资和近400人精锐团队的曦望，正站在从“可用”到“好用”、从“独角兽”到“产业龙头”的关键跃迁门槛上。

接下来，S3的量产交付效果和生态建设的深度，将是市场检验这家纯推理GPU独角兽成色的最终标尺。

如果曦望能够持续保持技术领先优势，加快产品落地和生态完善，有望在全球推理GPU市场占据一席之地，为中国AI产业的自主可控发展提供坚实的算力支撑。

敬告读者：本文基于公开资料信息或受访者提供的相关内容撰写，《不慌实验室》及文章作者不保证相关信息资料的完整性和准确性。无论何种情况下，本文内容均不构成投资建议。市场有风险，投资需谨慎！未经许可不得转载、抄袭！

分享收藏举报

标签1：赛道厂商落地智能芯片

财经号声明：本文由入驻中金在线财经号平台的作者撰写，观点仅代表作者本人，不代表中金在线立场。仅供读者参考，并不构成投资建议。投资者据此操作，风险自担。同时提醒网友提高风险意识，请勿私下汇款给自媒体作者，避免造成金钱损失，风险自负。如有文章和图片作品版权及其他问题，请联系本站。

0条评论网友评论文明上网，理性发言

查看更多评论

曦望新获超10亿融资，S3芯片目标百万Token一分钱

严苛标准

推理落地

日趋白热化

0条评论网友评论文明上网，理性发言

举报此人

不慌实验室

推荐财经号换一批

热门视频换一批

友情链接

温馨提示

鲜花打赏 X

温馨提示

曦望新获超10亿融资，S3芯片目标百万Token一分钱

严苛标准

推理落地

日趋白热化

0条评论 网友评论文明上网，理性发言

举报此人

不慌实验室

推荐财经号 换一批

热门视频换一批

友情链接

温馨提示

鲜花打赏 X

温馨提示

0条评论网友评论文明上网，理性发言

推荐财经号换一批