首页 手机网 财经号下载
入驻财经号 登录 客服 |
首页> 财经> 正文

企业AI应用的"数据鸿沟":为什么没有数据积累,就没有真AI?

财经号APP
界面有连云界面有连云 2025-12-31 15:00:31 81
分享到:

ChatGPT的横空出世,让整个世界见识到了大模型的强大能力。但当企业兴冲冲地想要将这些通用大模型应用到自己的业务中时,却往往发现"理想很丰满,现实很骨感"——模型回答很通用但不够精准,生成的内容缺乏行业专业性,无法真正解决企业的个性化问题。

问题出在哪里?明略科技创始人吴明辉给出了一个被很多人忽视的答案:数据积累。在他看来,没有深厚的行业数据积累作为支撑,AI就只能停留在表面应用,无法真正成为企业可信赖的生产力工具。

通用大模型的"最后一米"困境

2023年被称为"大模型元年",从GPT-4到文心一言,从通义千问到讯飞星火,各种大模型如雨后春笋般涌现。这些模型在通用任务上表现惊艳,写诗作文、编程答题都不在话下。但企业在实际应用中却面临着"最后一米"的困境。

一位制造业企业的CIO向记者抱怨:"我们尝试用通用大模型来优化生产流程,但它给出的建议太宏观、太理论化,根本无法直接应用到我们的实际场景中。我们需要的是基于我们自己的生产数据、工艺参数、质量标准的个性化方案。"

这种困境背后,是通用大模型的本质局限——它们虽然在海量互联网数据上训练,拥有广泛的知识储备,但对于企业的特定业务场景、行业know-how、历史数据积累却知之甚少。就像一位博学的通才,虽然知识面广,但在特定领域的深度和精度上,往往比不过浸淫多年的行家。

中国AI开发者应用生态调研报告指出,企业在将AI技术应用于实际业务流程时,普遍缺乏合适的流程和场景,数据资源的不足和质量问题依然制约着AI的推广。这揭示了一个残酷的事实:技术再先进,如果没有与之匹配的数据基础,AI应用就是"无米之炊"。

数据积累是企业AI的"暗物质"

在物理学中,"暗物质"虽然看不见摸不着,但却占据了宇宙质量的大部分,决定着宇宙的结构和演化。在企业AI应用中,数据积累就是这样的"暗物质"——不显山不露水,但却是决定AI能否落地、能否创造价值的关键因素。

明略科技的发展历程,恰好印证了这一点。2006年,吴明辉在北京大学读研期间创立秒针系统,最初只是一个互联网广告监测工具。但随着业务的开展,秒针系统开始积累海量的营销数据——广告投放数据、用户行为数据、媒体价值数据等。

这些数据在当时看来或许只是业务的"副产品",但在AI时代却成为了明略最宝贵的资产。当其他企业还在为缺乏训练数据而苦恼时,明略已经拥有了覆盖主流社交媒体、日均处理千亿级广告请求的数据采集和处理能力。

更重要的是,这些数据不是孤立的数字,而是与业务场景深度绑定的"活数据"。每一条数据背后都对应着具体的业务场景、实际的商业问题、真实的决策需求。这种数据的价值,远远超过那些为了训练而爬取的"死数据"。

明略科技在招股书中披露,截至2025年6月,公司已为约135家《财富》全球500强企业提供服务,大客户留存率高达90%以上。这样的数据意味着,明略在近20年的服务过程中,积累了大量经过业务验证的高质量数据和场景洞察。这种积累,是新进入者无法在短期内复制的。

从数据孤岛到智能中台:明略的技术破局

拥有数据只是第一步,如何让数据真正"活起来"、转化为智能,才是更大的挑战。企业往往面临着"数据孤岛"的困境——ERP系统里有一套数据、CRM系统里有一套数据、生产系统里又有一套数据,彼此割裂,无法形成合力。

明略科技在这方面进行了系统性的技术布局。依托多模态数据智能、企业级知识图谱和数据隐私技术三大核心技术,明略不仅能够采集和存储数据,更能够将分散在各个系统中的异构数据进行整合、清洗、关联,构建起企业的统一数据资产。

以知识图谱技术为例,明略在这一领域的投入可以追溯到早期。2020年,公司凭借知识图谱自动构建及行业应用的技术成果获得吴文俊人工智能科学技术奖一等奖。这项技术能够将企业的结构化数据、文档、视频、图像等多维数据进行抽取与融合,构建起反映业务逻辑和知识关联的知识图谱。

更关键的是,明略建立了完整的数据治理体系。在数据隐私和安全日益受到重视的今天,明略实施了全面的数据隐私保护机制和数据伦理框架,在提供智能服务的同时,严格保护客户数据和个人隐私。这种对数据治理的重视,让企业可以放心地将自己的核心数据交给明略进行智能化改造。

通过这套技术体系,明略将企业原本分散、孤立的数据,转化为可以支撑AI应用的统一"燃料库"。就像汽车需要汽油才能跑起来,AI应用需要高质量的数据才能发挥作用。明略做的,就是帮企业把分散的"小油罐"整合成统一的"大油库",并且确保油的质量和安全。

可信AI的数据基础

在AI领域,"可信"是一个高频词,但什么才算真正的可信?明略科技给出的答案是:数据质量决定输出质量,数据深度决定应用深度。

通用大模型之所以在某些场景下不够可信,很大程度上是因为它的训练数据来源广泛但质量参差不齐,且缺乏对特定领域的深度覆盖。当模型被问到专业问题时,就容易出现"一本正经地胡说八道"的情况,业界称之为"幻觉"。

明略的数据优势恰恰能够有效解决这个问题。因为数据来自真实的业务场景,经过多年的业务验证,且有明确的业务标注和质量控制,所以基于这些数据训练或微调的模型,能够给出更加准确、更加可靠的输出。

数据壁垒:AI时代的核心竞争力

在互联网时代,大家常说"得流量者得天下"。到了AI时代,这句话或许要改成"得数据者得天下"。而且这里的"数据"不是简单的数据量,而是高质量的、与业务场景深度绑定的行业数据。

从这个角度看,明略科技用近20年时间建立起的数据壁垒,是其最核心的竞争力。这种壁垒有几个特点:

一是积累时间长。从2006年到2025年,明略在营销智能和营运智能领域持续深耕,每一天都在产生和积累新的数据。这种时间维度的优势,是后来者无法通过资金或技术快速追赶的。

二是数据质量高。明略服务的客户包括135家《财富》全球500强公司,这些企业的业务复杂度高、数据规范性强、决策要求严,为明略提供了大量高质量的训练样本。

三是场景覆盖广。明略的业务从线上营销到线下门店,从消费品到工业制造,积累了跨行业、跨场景的数据和经验,这种广度让明略能够提供更加全面的解决方案。

四是持续更新。明略不是一次性地积累数据,而是通过持续的客户服务,不断地更新和丰富自己的数据资产,保持数据的时效性和相关性。

正是基于这样的数据壁垒,明略在面对新技术浪潮时,能够快速将通用技术转化为行业解决方案。当DeepSeek等开源大模型引爆企业级市场时,明略不是简单地接入这些模型,而是将它们与自己的数据资产深度融合,开发出更加适合企业应用的定制化产品。

在AI产业化的进程中,技术的光芒往往最耀眼,但数据的价值却最容易被忽视。明略科技用近20年的实践告诉我们,在企业AI应用中,数据积累不是锦上添花,而是雪中送炭;不是可有可无,而是必不可少。

没有数据积累作为支撑,AI就像是建在沙滩上的城堡,看起来壮观但经不起考验。只有扎根于深厚的数据基础之上,AI才能真正成为企业可信赖的生产力工具,才能创造出可持续的商业价值。

以上内容与数据,与有连云立场无关,不构成投资建议。据此操作,风险自担。

财经号声明: 本文由入驻中金在线财经号平台的作者撰写,观点仅代表作者本人,不代表中金在线立场。仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。同时提醒网友提高风险意识,请勿私下汇款给自媒体作者,避免造成金钱损失,风险自负。如有文章和图片作品版权及其他问题,请联系本站。

0条评论 网友评论文明上网,理性发言

中金登录 微博登录 QQ登录

    查看更多评论

    举报此人

    X
    确认
    取消

    热门视频换一批

    温馨提示

    由于您的浏览器非微信客户端浏览器,无法继续支付,如需支付,请于微信中打开链接付款。(点击复制--打开微信--选择”自己“或”文件传输助手“--粘贴链接--打开后付款)

    或关注微信公众号<中金在线>底部菜单”名博看市“,搜索您要的作者名称或文章名称。给您带来的不便尽请谅解!感谢您的支持!

    复制链接

    鲜花打赏 X

    可用金币:0

    总支付金额:0

    您还需要支付0
    我已阅读《增值服务协议》
    确认打赏

    1鲜花=0.1元人民币=1金币    打赏无悔,概不退款

    举报文章问题 X
    参考地址

    其他问题,我要吐槽

    确定

    温馨提示

    前往财经号APP听深入解析

    取消 确认