曦望新获超10亿融资,S3芯片目标百万Token一分钱

4月20日消息,国内全栈自研AI推理GPU企业曦望(Sunrise)宣布完成新一轮超10亿元融资,由杭州资本领投,多家产业方战投、地方国资及头部财务机构共同参与。
严苛标准
这是2026年AI产业全面迈入“推理落地、智能体普及”时代后,国内GPU赛道诞生的最大单笔融资之一。
前身为商汤科技大芯片部门的曦望,自2024年底分拆独立仅一年多,便完成了七轮融资,累计融资额约40亿元,估值突破百亿大关,成为国内首家纯推理GPU独角兽。
本轮资金将主要用于三大方向:新一代启望S3推理GPU的规模化量产交付、全栈软件生态建设,以及S4高性能推理GPU、S5安全可控推理GPU的后续研发迭代。
目前曦望团队规模约400人,研发人员占比超80%,汇聚了来自英伟达、AMD、华为海思、昆仑芯等顶尖企业的核心人才。公司已推进三代推理GPU迭代,数万颗GPU量产落地,实现了从芯片研发、产品量产到解决方案交付的完整闭环,并保持着“芯片均实现一次性流片成功”的严苛标准。
2026年1月,曦望发布旗舰产品启望S3推理GPU,这是国内首款搭载LPDDR6且兼容LPDDR5X内存的推理GPU。它没有盲目照搬高端训练GPU的HBM显存路线,而是基于智能体推理的本质需求,从AI Core计算架构到内存IO系统进行了全链路重构。
以OpenClaw为代表的智能体推理,“感知—规划—执行—反馈”的高频循环带来了对KV-cache密集访问的全新计算负载,而通用GPU面向训练优化,推理实际算力利用率往往远低于峰值。
推理落地
启望S3通过裁剪训练态所需的冗余模块,将节省出的晶体管与功耗预算全部集中投向推理,让单位面积有效算力效率提升5倍以上。
在大语言模型推理中占总计算量90%以上的GEMM与Flash Attention算子,启望S3将其利用率分别推至约99%与98%,原生支持从FP16到FP4的全链路低精度运算,推理性能较上一代S2提升5倍,目标实现Token成本下降90%。
在DeepSeek V3/R1满血版等主流大模型推理场景中,单位Token推理成本较上一代降低约90%,达成了“百万Token一分钱”的工程能力。
曦望的百亿估值,根植于AI产业正在发生的深刻结构性转折,算力的重心正从训练加速转向推理落地。
2026年被行业公认为“AI智能体元年”,德勤与CES 2026市场研究数据显示,2025年推理已占到全部AI算力支出的50%,2026年这一比例跃升至70%以上,是训练算力的4.5倍,全球推理芯片市场规模约1450亿美元。
联想CEO杨元庆判断,AI支出结构将从“80%训练+20%推理”完全翻转为“20%训练+80%推理”;英伟达黄仁勋预计2027年AI推理芯片潜在市场可达1万亿美元。
在中国市场,2026至2030年GPU市场规模预计从2050亿元攀升至5420亿元,推理需求爆发是核心增长引擎。
与此同时,推理算力租赁价格半年涨幅近40%,阿里云、百度云、腾讯等云厂商近期纷纷上调算力产品价格,涨幅达5%至34%。
日趋白热化
这一“算力通胀”背景下,曦望将推理成本下降90%作为核心目标,其意义远不止于企业自身的商业成功。不同于多数国产芯片厂商的“训推一体”路线,曦望从创立之初便坚定All-in推理赛道,以用户真实的Token成本、单位能耗和服务稳定性为芯片设计核心。
产业资本阵容涵盖三一集团、第四范式、美的控股、游族网络等,形成了“芯片从设计第一天起就有了客户”的深度绑定模式,它们不仅是投资者,更是首批核心客户,让曦望能够在实际使用中获得一手反馈,持续优化产品易用性。
曦望已与第四范式推出“百万Token一分钱”推理成本计划,业务触角延伸至政府智算中心、信创、金融、医疗、能源等国家重点领域。
不过,曦望的突围之路并非坦途,行业竞争与生态短板仍是其必须直面的核心考验。在国际巨头层面,英伟达早已重兵布局推理赛道,其新一代Blackwell架构推理性能较H100提升4倍,正加速规模化落地;同时斥资200亿美元拿下Groq技术授权并吸纳核心团队,进一步补强推理算力布局,意图巩固市场主导地位。
国内赛道同样竞争激烈,华为昇腾、寒武纪等头部厂商持续加码推理芯片研发,本土企业间的市场争夺日趋白热化。
而软件生态仍是国产芯片的普遍短板,尽管曦望已实现指令集、GPGPU IP、编译工具链全栈自研,且兼容CUDA与主流AI框架,但在开发者社群积累、场景化应用适配等方面,与英伟达成熟生态仍存在明显差距。
此外,如何稳定获得先进制程产能,满足市场爆发式增长的需求,也是曦望需要解决的关键问题。
市场空间方面,预计2028年前后国产GPU在推理市场的占有率将突破40%,推理侧的巨大增量市场为国产替代提供了前所未有的战略机遇。
曦望已完成S4和S5芯片的技术路线规划,持续加码近存计算、光电共封装等前沿技术探索,200余项核心专利为其后续迭代奠定了技术根基。
手握约40亿累计融资和近400人精锐团队的曦望,正站在从“可用”到“好用”、从“独角兽”到“产业龙头”的关键跃迁门槛上。
接下来,S3的量产交付效果和生态建设的深度,将是市场检验这家纯推理GPU独角兽成色的最终标尺。
如果曦望能够持续保持技术领先优势,加快产品落地和生态完善,有望在全球推理GPU市场占据一席之地,为中国AI产业的自主可控发展提供坚实的算力支撑。
敬告读者:本文基于公开资料信息或受访者提供的相关内容撰写,《不慌实验室》及文章作者不保证相关信息资料的完整性和准确性。无论何种情况下,本文内容均不构成投资建议。市场有风险,投资需谨慎!未经许可不得转载、抄袭!
财经号声明: 本文由入驻中金在线财经号平台的作者撰写,观点仅代表作者本人,不代表中金在线立场。仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。同时提醒网友提高风险意识,请勿私下汇款给自媒体作者,避免造成金钱损失,风险自负。如有文章和图片作品版权及其他问题,请联系本站。
