首页 手机网 财经号下载
入驻财经号 登录 客服 |
首页> 财经> 正文

曦望新获超10亿融资,S3芯片目标百万Token一分钱

财经号APP
不慌实验室不慌实验室 2026-04-22 21:30:12 208
分享到:

  

  

  4月20日消息,国内全栈自研AI推理GPU企业曦望(Sunrise)宣布完成新一轮超10亿元融资,由杭州资本领投,多家产业方战投、地方国资及头部财务机构共同参与。

  

严苛标准

  

  这是2026年AI产业全面迈入“推理落地、智能体普及”时代后,国内GPU赛道诞生的最大单笔融资之一。

  

  前身为商汤科技大芯片部门的曦望,自2024年底分拆独立仅一年多,便完成了七轮融资,累计融资额约40亿元,估值突破百亿大关,成为国内首家纯推理GPU独角兽。

  

  本轮资金将主要用于三大方向:新一代启望S3推理GPU的规模化量产交付、全栈软件生态建设,以及S4高性能推理GPU、S5安全可控推理GPU的后续研发迭代。

  

  目前曦望团队规模约400人,研发人员占比超80%,汇聚了来自英伟达、AMD、华为海思、昆仑芯等顶尖企业的核心人才。公司已推进三代推理GPU迭代,数万颗GPU量产落地,实现了从芯片研发、产品量产到解决方案交付的完整闭环,并保持着“芯片均实现一次性流片成功”的严苛标准。

  

  2026年1月,曦望发布旗舰产品启望S3推理GPU,这是国内首款搭载LPDDR6且兼容LPDDR5X内存的推理GPU。它没有盲目照搬高端训练GPU的HBM显存路线,而是基于智能体推理的本质需求,从AI Core计算架构到内存IO系统进行了全链路重构。

  

  以OpenClaw为代表的智能体推理,“感知—规划—执行—反馈”的高频循环带来了对KV-cache密集访问的全新计算负载,而通用GPU面向训练优化,推理实际算力利用率往往远低于峰值。

  

推理落地

  

  启望S3通过裁剪训练态所需的冗余模块,将节省出的晶体管与功耗预算全部集中投向推理,让单位面积有效算力效率提升5倍以上。

  

  在大语言模型推理中占总计算量90%以上的GEMM与Flash Attention算子,启望S3将其利用率分别推至约99%与98%,原生支持从FP16到FP4的全链路低精度运算,推理性能较上一代S2提升5倍,目标实现Token成本下降90%。

  

  在DeepSeek V3/R1满血版等主流大模型推理场景中,单位Token推理成本较上一代降低约90%,达成了“百万Token一分钱”的工程能力。

  

  曦望的百亿估值,根植于AI产业正在发生的深刻结构性转折,算力的重心正从训练加速转向推理落地。

  

  2026年被行业公认为“AI智能体元年”,德勤与CES 2026市场研究数据显示,2025年推理已占到全部AI算力支出的50%,2026年这一比例跃升至70%以上,是训练算力的4.5倍,全球推理芯片市场规模约1450亿美元。

  

  联想CEO杨元庆判断,AI支出结构将从“80%训练+20%推理”完全翻转为“20%训练+80%推理”;英伟达黄仁勋预计2027年AI推理芯片潜在市场可达1万亿美元。

  

  在中国市场,2026至2030年GPU市场规模预计从2050亿元攀升至5420亿元,推理需求爆发是核心增长引擎。

  

  与此同时,推理算力租赁价格半年涨幅近40%,阿里云、百度云、腾讯等云厂商近期纷纷上调算力产品价格,涨幅达5%至34%。

  

日趋白热化

  

  这一“算力通胀”背景下,曦望将推理成本下降90%作为核心目标,其意义远不止于企业自身的商业成功。不同于多数国产芯片厂商的“训推一体”路线,曦望从创立之初便坚定All-in推理赛道,以用户真实的Token成本、单位能耗和服务稳定性为芯片设计核心。

  

  产业资本阵容涵盖三一集团、第四范式、美的控股、游族网络等,形成了“芯片从设计第一天起就有了客户”的深度绑定模式,它们不仅是投资者,更是首批核心客户,让曦望能够在实际使用中获得一手反馈,持续优化产品易用性。

  

  曦望已与第四范式推出“百万Token一分钱”推理成本计划,业务触角延伸至政府智算中心、信创、金融、医疗、能源等国家重点领域。

  

  不过,曦望的突围之路并非坦途,行业竞争与生态短板仍是其必须直面的核心考验。在国际巨头层面,英伟达早已重兵布局推理赛道,其新一代Blackwell架构推理性能较H100提升4倍,正加速规模化落地;同时斥资200亿美元拿下Groq技术授权并吸纳核心团队,进一步补强推理算力布局,意图巩固市场主导地位。

  

  国内赛道同样竞争激烈,华为昇腾、寒武纪等头部厂商持续加码推理芯片研发,本土企业间的市场争夺日趋白热化。

  

  而软件生态仍是国产芯片的普遍短板,尽管曦望已实现指令集、GPGPU IP、编译工具链全栈自研,且兼容CUDA与主流AI框架,但在开发者社群积累、场景化应用适配等方面,与英伟达成熟生态仍存在明显差距。

  

  此外,如何稳定获得先进制程产能,满足市场爆发式增长的需求,也是曦望需要解决的关键问题。

  

  市场空间方面,预计2028年前后国产GPU在推理市场的占有率将突破40%,推理侧的巨大增量市场为国产替代提供了前所未有的战略机遇。

  

  曦望已完成S4和S5芯片的技术路线规划,持续加码近存计算、光电共封装等前沿技术探索,200余项核心专利为其后续迭代奠定了技术根基。

  

  手握约40亿累计融资和近400人精锐团队的曦望,正站在从“可用”到“好用”、从“独角兽”到“产业龙头”的关键跃迁门槛上。

  

  接下来,S3的量产交付效果和生态建设的深度,将是市场检验这家纯推理GPU独角兽成色的最终标尺。

  

  如果曦望能够持续保持技术领先优势,加快产品落地和生态完善,有望在全球推理GPU市场占据一席之地,为中国AI产业的自主可控发展提供坚实的算力支撑。

  

  敬告读者:本文基于公开资料信息或受访者提供的相关内容撰写,《不慌实验室》及文章作者不保证相关信息资料的完整性和准确性。无论何种情况下,本文内容均不构成投资建议。市场有风险,投资需谨慎!未经许可不得转载、抄袭!

  

财经号声明: 本文由入驻中金在线财经号平台的作者撰写,观点仅代表作者本人,不代表中金在线立场。仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。同时提醒网友提高风险意识,请勿私下汇款给自媒体作者,避免造成金钱损失,风险自负。如有文章和图片作品版权及其他问题,请联系本站。

0条评论 网友评论文明上网,理性发言

中金登录 微博登录 QQ登录

    查看更多评论

    举报此人

    X
    确认
    取消

    热门视频换一批

    温馨提示

    由于您的浏览器非微信客户端浏览器,无法继续支付,如需支付,请于微信中打开链接付款。(点击复制--打开微信--选择”自己“或”文件传输助手“--粘贴链接--打开后付款)

    或关注微信公众号<中金在线>底部菜单”名博看市“,搜索您要的作者名称或文章名称。给您带来的不便尽请谅解!感谢您的支持!

    复制链接

    鲜花打赏 X

    可用金币:0

    总支付金额:0

    您还需要支付0
    我已阅读《增值服务协议》
    确认打赏

    1鲜花=0.1元人民币=1金币    打赏无悔,概不退款

    举报文章问题 X
    参考地址

    其他问题,我要吐槽

    确定

    温馨提示

    前往财经号APP听深入解析

    取消 确认