闫俊杰应战AI“淘汰赛”
近日,MiniMax技术迭代再次提速,正式发布文本模型MiniMax-M2.1系列。不同于以往的通用叙事,官方将其定义为“专为现实世界编码与 AI 原生组织”打造的基座。
在SWE-multilingual与VIBE-bench测试中,这款SOTA级别的10B激活参数模型,分别拿下了72.5%和88.6%的高分。更关键的是,这一成绩超越了Gemini 3 Pro与Claude 4.5 Sonnet,在技术指标上压倒闭源巨头,是MiniMax冲击“全球化 AGI 第一股”最硬的底牌。

就在几天前,智谱AI率先挂出聆讯后招股书,不到48小时,MiniMax的招股书也出现在港交所的案头。如果进程顺利,这家成立不满四年的公司,将刷新AI独角兽从创立到 IPO的最短纪录。
两家头部独角兽,一前一后,争夺着通往二级市场的首发船票。但相比智谱AI浓厚的“学院派”底色与稳健的B端策略,MiniMax拿出的是一个让资本市场肾上腺素飙升的剧本,在融资超15亿美元、估值超25亿美元的华丽外衣下,是累计近百亿人民币的亏损。
透过招股书,我们可以看到这家公司稍显“激进”的画像:员工平均年龄29岁,董事会平均年龄仅32岁。这种“年轻”意味着极致的执行效率,但也暴露出某种缺乏缓冲的脆性,在高速旋转的离心机里,任何跟不上转速的组件,哪怕曾是核心引擎的一部分,也难免面临被剥离的命运。
与深耕国内存量市场的智谱不同,MiniMax选择了更广阔也更残酷的全球战场。数据显示,截至2025年前九个月,MiniMax营收同比增长超170%,其中海外收入占比突破70%。
这种“生而全球化”的收入结构,使其成为当前大模型赛道中,极少数能在大洋彼岸赚取高溢价的中国玩家。

即将迈入2026年,AI行业共识再次发生质变,单纯的模型参数竞赛已遭遇边际效应递减。Robin在接受《时代》采访时也再次强调应用层的决定性作用。“AI下一步”的答案,正从模型层下沉至场景层。
如何将Token转化为现金流,如何证明高增长并非依赖 VC 输血的“虚荣指标”,成为所有玩家必须直面的拷问。对于那些尚未背靠大厂生态、仅凭单一产品形态裸泳的AI公司而言,这种转向带来的不是机会,而是一场更为严苛的生存压力测试。
因此,这不仅关乎闫俊杰个人的成败,对迷雾中的中国大模型行业,这也是一次必须有人去完成的探路。在欢呼与质疑的夹缝中,闫俊杰正在公众视野下演绎一场真实的“MiniMax”博弈,在极小的生存概率(Mini)中,通过极致的决策与执行,博取极大的战略回报(Max)。
01、天才少年的“情感连接”
创办MiniMax之前,闫俊杰是典型的“系统内优胜者”:中科院博士出身,在深度学习爆发前夜入局,后在商汤科技一路狂奔至副总裁。
彼时,“清华帮”的学院派、大厂辞职创业的技术大拿为首的AI行业聚光灯仍停留在计算机视觉(CV)构建的“判别式”世界里。主要内容是“识别”,例如教会机器辨认“这是一只猫”或“那是一个杯子”。
但GPT-3的出现划开了一道裂缝。闫俊杰敏锐地感知到,AI1.0时代的“识别”已触及天花板,而基于Transformer架构的“生成”与“交互”才是通往 AGI 的钥匙。在他看来,AI不应止步于冷冰冰的分类器,而应进化为具备创作能力与交互深度的“创作者”。
2021年冬,闫俊杰做了一个违背当时创投圈共识的决定,切入ToC赛道。在那个“AI伴侣”被普遍视为伪需求、投资人更青睐B端落地的年份,闫俊杰选择了一条更窄、也更难的路。
但与同行们都在标榜“中国的OpenAI”,为了AGl愿景而堆叠参数的赛道上狂奔不同,MiniMax从第一天起,似乎就更想做中国的“A1版迪士尼”+“超级链接者”。
也不同于杨植麟相信少数精英引领技术突破的“天才叙事”,闫俊杰将公司视为一个可以优化的复杂函数,而“用户交互数据”就是这个函数中梯度下降最快的变量。
2022年,MiniMax推出的虚拟角色对话应用Glow成为这一理念的试验田。在元宇宙概念泡沫破灭、AI 落地场景迷茫的真空期,Glow在00后群体中实现了一场隐秘的爆发。
简单说,它是当时中国最像电影《Her》的产品。用户在其中捏造理想的伴侣或二次元知己,AI 角色不再是机械的问答工具,而是提供情绪价值的“赛博伙伴”。
在接受《晚点 LatePost》采访时,闫俊杰曾坦言,团队针对性地找了不少年轻群体,比如二次元与AI爱好者,基于他们的体验与反馈做了快速迭代,让MiniMax尝到了“非共识”带来的早期红利。虎嗅报道,该产品上线4个月后,注册用户规模超过500万。
但 Glow 的爆红在验证“情感智能”商业潜力的同时,也迅速触碰到了现实世界的引力边界。2023年3月,上线仅半年的Glow突遭应用商店下架。尽管官方未披露具体原因,且彼时生成式AI的备案细则尚未落地,但“水面之下”的暗礁已现。据《智能涌现》报道,Glow 因过度迎合用户需求,导致大量非标擦边内容在平台泛滥。
顺带一提,这也是现在所有ToC类AI产品必须直面的“不可能三角”:在开放性、沉浸感与合规性之间,很难找到完美的平衡点。

后续,闫俊杰便调整了函数的求解方向。2023年6月,Talkie直接上线海外。
在 Character.ai 统治的北美市场,MiniMax硬是凭借更低延迟的模型响应与更细腻的语音交互,撕开了一道缺口。Sensor Tower数据显示,自发布以来,Talkie就长居全球陪伴类AI应用下载量的前三,另外两名则是美国的知名独角兽Characte.AI和Replika。
用户规模的激增带来了真金白银的广告与订阅收入。招股书显示,截至2025年9月,MiniMax海外收入占比已突破70%,覆盖200多个国家。这种极度外向型的收入结构,在当前的大模型赛道中极为罕见,也成为其估值的重要支撑。
Talkie的成功,甚至在国内引发了一波角色陪伴类AI应用的热潮。但无论是字节跳动的“猫箱”,还是在二次元社区红极一时的“捏Ta”,甚至于MiniMax自己同年9月在国内上线的“星野”,都未能复刻 Talkie 在全球市场的增长曲线。
这种鲜明的反差也印证了一个残酷的事实,所谓“生而全球”,并非单纯的战略远见,更多的是在国内流量内卷与合规高墙的双重挤压下,一种主客观环境倒逼出的生存本能。
毕竟,情感连接无论从哪个维度看,都是一门昂贵的生意。
对MiniMax、智谱等独角兽而言,Scaling Law的“性能红利”与“成本引力”同时生效:必须持续加码算力才能保持代际领先,但C端产品毛利率被推理成本迅速吞噬,形成“越赚钱越亏损”的反向杠杆。
为了维持高拟真、低延迟的“人感”交互,Talkie和星野消耗了惊人的推理算力。招股书披露了一个令人咋舌的数据:MiniMax AI原生产品在2024年的毛利率为-8.1%,直到2025年才勉强转正,但也仅有4.7%,利润空间很薄。
这解释了为什么闫俊杰在内部将“效率”视为最高纲领。MiniMax需要在资金窗口关闭前,找到让LTV(用户生命周期价值)不仅能覆盖 CAC(获客成本),更能跑赢摩尔定律失效下依然高昂的 Inference Cost(推理成本)的黄金平衡点。
在资本退潮的当下,闫俊杰必须证明,MiniMax的增长不全依赖融资输血,自带C端造血能力才是穿越周期的唯一船票。
02、MoE、视频与十亿美金的入场券
如果说ToC产品构成了MiniMax喧嚣的表象,那么底层的架构抉择便是其沉默的内核。
在大众认知中,应用型公司往往带有“技术薄弱”的偏见。但早在2023年,当国内大模型厂商大多还在Dense(稠密)架构的单一路径上死磕时,MiniMax就已经成为国内最早押注 MoE(混合专家模型)架构的团队之一。
这是一个典型的“闫俊杰式决策”:在算力资源有限的约束条件下,寻找系统效率的最优解。相比于Dense架构那种“全能却臃肿”的巨无霸模式,MoE 就像是一个精密的“专家团”,按需激活,专人专用。这种架构在保持高智商的同时,极大地压低了边际推理成本。
这一技术路线后来被GPT-4和DeepSeek验证为行业标准,但在当时,这无疑需要极大的技术自信与工程魄力。2024年4月,abab 6.5的发布成为这一赌注的回报,其性能直逼 GPT-4 Turbo,证明了 MiniMax 在算法侧的预判能力。
闫俊杰对“模型智力”的绝对依从,源于一次昂贵的试错。
据《晚点LatePost》报道,2022年底,Glow曾因一行极其隐蔽的算法Bug,导致模型对话质量下滑了约15%。对于普通用户而言,这似乎是难以感知的微小波动,但市场反馈冷酷而直接,元旦三天内,Glow的DAU暴跌40%。
这次事故成为了MiniMax内部的认知拐点。它用最极端的数据反映出了AI产品的脆弱本质,即用户对“智力”的敏感度远超预期。无论叠加多少精美的产品交互,如果模型能力无法突破阈值,所有的增长都不过是建立在沙堆之上的虚假繁荣。
2024年初,OpenAI发布Sora演示视频,视频生成瞬间成为新的技术高地。行业的焦虑感再次蔓延:跟,意味着要投入指数级增长的算力资源;不跟,则意味着在下一代内容载体中出局。

闫俊杰最终选择按下昂贵的“确认键”,2024年8月,MiniMax发布Video-01并集成至“海螺AI”。这一次,效果不是“可用”,而是“惊艳”。在权威评测中,其生成的视频在指令遵循与画面稳定性上名列前茅。海螺AI的网页端访问量随之飙升,成为全球视频生成领域的一匹黑马。
根据AI产品榜数据,自上线以来,海螺AI连续6个月在全球榜单中位居视频生成AI产品的第一,力压Sora、Runway等国内外AI视频明星产品。
今年6月18日发布的Hailuo 02,则进一步展示了MiniMax在“降本增效”上的工程能力。横向对比,Hailuo 02在Artificial Analysis Video Arena的Image-to-Video榜单中位列全球第二。
并且,在性能超越Google Veo3的前提下,其API调用成本仅为后者的1/9。这种极致的性价比源于双重驱动,一方面是Scaling Law的推波助澜,Hailuo 02模型参数量扩大3倍,数据量扩大4倍,使得模型能够理解更加复杂的指令和物理场景。
另一方面是精细化的架构创新,Hailuo 02采用了NCR架构。通过噪声感知机制,模型能动态分配计算资源,将HBM内存读写量削减逾70%,从而让训推效率提升了 2.5 倍。在AI的下半场,技术先进性不仅意味着效果,更意味着谁能以更低的成本交付智能。
这种“重产品、重C端”的打法,让MiniMax在财务报表上呈现出一种奇特的张力。

相较智谱AI三年半6.2亿元的营收,招股书显示,MiniMax仅在2025年前九个月就达到5343万美元的收入。证明了AI的商业模式不必局限于“卖 API”的苦力活,同样可以是像游戏、社交一样具备爆发力的印钞机。
不过,硬币的另一面是惊人的消耗。MiniMax成立以来累计亏损达13.2亿美元,其中仅2025年前九个月的亏损就超过了5亿美元。这一数字不仅超过了智谱,也远超市场预期。
研发开支是最大的黑洞,近四年的投入接近4.5亿美元。显然,为了维持“聪明的头脑”,MiniMax 正在以一种惊人的速度燃烧资本。
《新立场》认为,在国产芯片替代的大背景下,算力就是硬通货,也是最大的成本项。为了支撑abab文本模型、Speech语音模型以及海螺背后吞金兽般的视频模型,MiniMax必须在算力军备竞赛中持续下注。
这正是MiniMax必须冲击IPO的核心逻辑。尽管招股书显示其账上躺着11.02亿美元的现金储备,但这笔钱在巨头面前显得杯水车薪。GPT-5的训练成本预计高达数十亿美元,而据《金融时报》报道,字节跳动初步计划在2026年投入230亿美元的资本支出。在这场AI巨头的“饱和式进攻”中,11亿美元并不一定能买到一张决赛圈的门票。
焦虑感或许早已在内部蔓延。今年2月,MiniMax合伙人、副总裁魏伟悄然离职。据《字母榜》透露,其离职的导火索之一是融资KPI未达标。当一家独角兽开始用KPI硬性考核高管的融资能力时,其对资金的饥渴程度已不言而喻。
对于MiniMax而言,IPO不仅仅是投资人退出的通道,也是获取持续弹药的生命线。The Information将其描述为“中国加速科技 IPO 以对抗美国 AI 竞争”的宏大叙事,但在微观层面,这是闫俊杰为公司争取到的“续命钱”,也是他对抗巨头碾压的唯一筹码。
03、写在最后
回到原点,智能的本质究竟是什么?闫俊杰的答案或许是:对交互效率的极致压缩。
MiniMax的故事,其实就是不断升级这种“交互”的故事。与背负着沉重历史包袱的大厂不同,也与固守教条的学院派迥异,它更像是充满好奇心的少年。它左手握着最硬核的底层技术(MoE、视频生成),右手试图打破人机交互的“第四堵墙”,将AI从工具还原为伙伴。
闫俊杰将公司命名为MiniMax,取自博弈论中的“极小化极大算法”(Minimax Algorithm),这似乎成为了这家公司命运的一句谶语:在资源受限、强敌环伺的“最坏情况”下,通过极致的算法求解,博取那个“最好结果”。
但时间来到2025年,技术信仰的光环开始祛魅,商业规则的引力重新占据主导。
智谱AI与MiniMax的接连交表,标志着“大模型六小龙”那个野蛮生长的草莽时代正式终结。接下来的故事,不再是关于Arxiv上的论文引用量,也不再是关于创始人的天才光环,而是回归到商业的本质逻辑。
对于闫俊杰而言,真正的考验才刚刚开始。他不仅要向港交所证明MiniMax配得上百亿估值,还要向世界证明一个关于中国创新的新叙事——在这片特殊的土壤上,除了成为巨头的附庸、除了在ToB泥潭中做定制化的“苦力”,依然存留着一种可能性,诞生一家生而全球、用技术定义产品的伟大公司。
*题图及文中配图来源于网络。
财经号声明: 本文由入驻中金在线财经号平台的作者撰写,观点仅代表作者本人,不代表中金在线立场。仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。同时提醒网友提高风险意识,请勿私下汇款给自媒体作者,避免造成金钱损失,风险自负。如有文章和图片作品版权及其他问题,请联系本站。
