国产算力「大考」通关：DeepSeek 迁居，美团 Long

财经号APP

蓝洞商业 2026-05-09 18:56:21

分享到：

AI 能力的重要落点，是物理世界。

撰文|蓝洞商业于玮琳

今年伊始，海外科技圈都在关注中国的算力问题。

1 月，马斯克在播客中称，中国在 AI 算力上「将远超世界其他地区」。2 月份，OpenAI 首席执行官奥特曼说，中国在人工智能领域的技术进步「快得惊人」。

2025 年可以说是供给端的集结之年。摩尔线程、沐曦股份等国产 GPU 接连登陆资本市场，国产大模型的产业基础进一步加深。2026 年，变化向产业链下游传导，4 月下旬，多款国产大模型发布新版本。

4 月 20 日，月之暗面推出擅长长程代码编写的 Kimi K2.6 模型。4月 24 日，DeepSeek V4 发布，随后美团 LongCat-2.0-Preview 开放测试，两者总参数规模均突破万亿，且均支持 1M 超长上下文。

值得一提的是，DeepSeek V4 完成了从英伟达体系向华为昇腾平台的迁移与适配；而美团 LongCat2.0 则是训练推理全程基于国产算力的万亿参数大模型，使用了 5 万至 6 万张国产算力芯片。

长久以来，中国 AI 从业者，普遍策略是搭上已有的成熟方案。现在，国内 AI 企业开始尝试铺设自己的轨道。

在荒野修路

你该如何完成一次艰难的任务呢？

科幻作家阿瑟·克拉克的答案是：「唯一的办法是让不可能本身，成为前进的起点。」

DeepSeek V4 从最初定档到最终发布，发布时间调整了多次。外部普遍推测，原因之一，就是需要将核心代码从英伟达的 CUDA 迁移出来。

CUDA 生态经过十几年的打磨，已是一个功能强大、工具完备的开发平台。迁移代码的过程，意味着开发团队需要做大量底层框架的重构工作。

最终 DeepSeek 做到了，V4 发布两日后，摩根大通在报告中指出，V4 成功适配华为昇腾芯片，验证了国产算力在前沿 AI 推理上的可行性；且 DeepSeek 通过混合注意力架构等底层技术创新，显著降低了推理成本。

DeepSeek 用技术极客的方式降本增效，通过重写半个大模型的工作量完成硬核迁移。同日开放测试的美团 LongCat-2.0-Preview，则是直接跑在国产算力之上。

国产算力在工程层面，有哪些难点？不妨以 LongCat-2.0-Preview 为例看看。

第一个难点，是物理层面的。国产硬件底座的显存容量和带宽与英伟达芯片有差异，训练部署万亿参数模型时，美团团队在工程方面有不小的挑战，需要用更多精力去调试并行策略、优化显存。

第二难点是软件生态的成熟度，针对国产芯片的特性，确保训练全程的精确可复现，团队需要重写和优化核心算子，以及自研全确定性的算子。

第三个难点，是万卡集群的稳定性，在动用 5 万- 6 万张国产算力卡的超大规模集群上，硬件故障难以避免。为此，团队构建了一套完整的容错与自动恢复体系。

最后，针对国产硬件的特点，团队在训练框架和模型结构进行针对性的亲和设计，打破了通用框架的适配局限，提升了计算性能。

DeepSeek 的算法优化降低了算力的门槛，把模型的价格打了下来；美团的工程实践则证明国产芯片的可行性。这些探索，也给国产芯片生态沉淀出工程能力和经验。

梁文锋曾说：「我们不是有意成为一条鲶鱼，只是不小心成了一条鲶鱼」，而今「鲶鱼效应」已经显现，DeepSeek 并不独行。

从单点到系统

腾讯云的汤道生曾有这样一个比喻：「大模型是发动机，使用者是驾驶员」。使用者很容易注意到发动机的性能，但优秀的驾驶员，会意识到燃料与底盘同样重要。

中国算力的发展，依赖的是整条产业链的协同进步。各个环节的核心企业，都在持续发力。

在制造端，公开数据表明，中国芯片产量节节攀升。中芯国际、华虹半导体等企业正推进多重曝光等工艺攻关，试图在物理极限中寻找平衡点。

在算力端，华为昇腾 910C 等产品的实践表明，通过极致的集群线性加速比，也能跑通体量巨大的模型训练。

「得生态者得天下」。英伟达 CUDA 构建的护城河之所以深厚，一个重要原因是形成了普适性的软硬件兼容标准。

行业从业者也意识到这一点。比如寒武纪推出基础软件平台，兼容主流框架，降低开发者的迁移门槛。智源人工智能研究院牵头的开源系统，构建了统一的底层接口，让上层模型可以运行在多种不同的国产芯片上。

国内互联网大厂也有很多动作，百度的双轨战略，字节跳动的千亿投入，都在为算力底座寻找更优解。

据公开数据梳理，在过去几年中，美团至少布局了 21 家覆盖半导体/智能硬件和通用大模型领域的相关公司。其中，既包括芯片算力层的摩尔线程、沐曦股份，以及视觉芯片领域的爱芯元智；也包括新材料等细分赛道的广州众山等多家企业。

在技术长期保持跟进的同时，产业资本也在做算力的投资人和共建者，逐渐形成正向循环。

从数字世界，到现实任务

「当下人工智能正处于第三次浪潮的重要拐点，大模型正推动其从弱人工智能迈向通用人工智能，更关键的是，推动机器人从 1.0 专用机器人时代进入 2.0 通用具身智能时代。」

北京智源人工智能研究院院长王仲远的话，点出 AI 能力的重要落点，是物理世界。

一方面，众多国产厂商正致力于让大模型在云端「读万卷书」，提升模型的智慧、逻辑推理的严密性。另一方面，也要让大模型「行万里路」，比如文心大模型被植入到自动驾驶的决策系统中；混元大模型的工业质检方案，已出现在多个流水线场景。

美团的外卖、到店、酒旅等业务，构成了日常生活中最复杂的任务执行网络。这里有海量的的真实场景：从商家后厨的出餐速度，到骑手在暴雨中的配送路径，再到用户深夜的一句「想吃火锅」。

王兴曾明确提出，要将美团 App 率先升级成「AI-powered App」。这意味着，LongCat 的训练目标不仅是回答「哪家的小炒肉好吃」，更要「找到这家店，选出最佳的团购券，然后预定 2 个周五晚上 7 点钟的座位」。

这意味着任务交付的效果尤为重要，也解释了美团为何强调要打造物理世界的 AI 底座。

从参数提升到算力跑通，国产大模型正在完成从「能用」到「好用」的进阶。

这条路没有捷径。未来，当算法、算力、资金与场景持续产生化学反应，中国 AI 的故事，也将从「单点突破」翻到「系统进化」这一页。

分享收藏举报

标签1：框架芯片鲶鱼美团硬件

财经号声明：本文由入驻中金在线财经号平台的作者撰写，观点仅代表作者本人，不代表中金在线立场。仅供读者参考，并不构成投资建议。投资者据此操作，风险自担。同时提醒网友提高风险意识，请勿私下汇款给自媒体作者，避免造成金钱损失，风险自负。如有文章和图片作品版权及其他问题，请联系本站。

0条评论网友评论文明上网，理性发言

查看更多评论

国产算力「大考」通关：DeepSeek 迁居，美团 Long

在荒野修路

从单点到系统

从数字世界，到现实任务

0条评论网友评论文明上网，理性发言

举报此人

蓝洞商业

推荐财经号换一批

热门视频换一批

友情链接

温馨提示

鲜花打赏 X

温馨提示

国产算力「大考」通关：DeepSeek 迁居，美团 Long

在荒野修路

从单点到系统

从数字世界，到现实任务

0条评论 网友评论文明上网，理性发言

举报此人

蓝洞商业

推荐财经号 换一批

热门视频换一批

友情链接

温馨提示

鲜花打赏 X

温馨提示

0条评论网友评论文明上网，理性发言

推荐财经号换一批