申万宏源:AI Infra已成为AI应用落地关键 “卖铲人” 看好OLTP与向量数据库方向
智通财经APP获悉,申万宏源发布研报称,AI Infra作为AI模型训练与推理的底层支撑,已成为应用落地的关键 “卖铲人”。算力调度是决定模型推理盈利水平的核心变量,国内模型Token收费显著低于海外,成本敏感度更高。据测算,在单日10亿查询量下,若使用H800芯片,单卡吞吐能力每提升10%,毛利率能够提升2-7个百分点。生成式AI+Agent加速渗透,AI infra软件作为应用部署的基础设施,有望进入高速增长期。看好高实时性、可灵活拓展的分布式交易型数据库厂商(OLTP),以及增量的向量数据库。
申万宏源主要观点如下:
算力调度是决定模型推理盈利水平的核心变量
国内模型Token收费显著低于海外,成本敏感度更高。阿里Aegaeon通过Token级调度可减少82% GPU用量,华为Flex:ai提升30% 算力利用率,高效调度能力成为模型推理厂商盈利关键。根据申万宏源测算,在单日10亿查询量下,若使用H800芯片,单卡吞吐能力每提升10%,毛利率能够提升2-7个百分点。
数据类Infra需求先于应用爆发,向量数据库成刚需
RAG技术渗透率快速提升,Gartner预测2025年企业采用率将达68%。向量数据库作为RAG核心组件,支撑海量数据毫秒级检索,市场需求持续高增。
AI时代数据架构从“分析优先”转向“实时运营+分析协同”,行业发生了几点重要的变化:1)NoSQL+OLTP数据库再风靡,通过补充向量索引能力切入向量数据库市场;2)数据湖、数据仓库厂商(OLAP为主)通过并购、合作方式引入AI模型,向全栈工具迈进。
MongoDB凭借 “低门槛 + 高弹性”,契合中小客户低成本AI落地需求,增长弹性突出。MongoDB作为文档型NoSQL数据库,其适配非结构化数据存储与高频实时CRUD操作,契合AI原生应用与Agent需求,2025年收购Voyage AI补齐向量检索能力。FY26Q3核心产品实现30%增速,增长弹性突出。
Snowflake与Databricks靠全流程工具链和客户粘性,占据数据密集型行业核心场景,但需应对CSP跨界竞争与实时能力短板。Snowflake与Databricks以OLAP为核心向全栈工具延伸,靠海量数据处理能力成为中大型企业首选,但TP能力暂有不足(尤其是Snowflake),面临中小市场渗透与云厂商挤压压力。
GPU主导数据控制中心,存储与数据库技术升级
NVIDIA推出SCADA方案实现GPU直连SSD,将IO延迟降至微秒级。向量数据库需适配GPU并行计算,通过列式存储、算子重写等技术升级,匹配AI实时推理需求。
相关标的
MongoDB(MDB.US)、达梦数据(688692.SH)、英方软件(688435.SH)、Snowflake(SNOW.US)、深信服(300454.SZ)等。
风险提示
商业化与IT支出不及预期;生态竞争加剧风险,云厂商自研与平台整合挤压份额;技术迭代与产品成熟度风险。
财经号声明: 本文由入驻中金在线财经号平台的作者撰写,观点仅代表作者本人,不代表中金在线立场。仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。同时提醒网友提高风险意识,请勿私下汇款给自媒体作者,避免造成金钱损失,风险自负。如有文章和图片作品版权及其他问题,请联系本站。
