手机 AI 新闻检索准确率大揭秘,你还能相信它说的吗?
在信息爆炸的时代,我们常常希望借助 AI 快速获取新闻资讯,了解事件全貌。但 AI 在新闻检索方面的表现真的可靠吗?近日,一项针对国产 AI 新闻引用可靠性的测试引发广泛关注。
美国宣布对贸易伙伴加征 “对等关税” 的消息引发市场动荡,手机新闻弹窗不断。有人试图借助 AI 总结 “美国最新关税加征政策对市场的影响”,AI 迅速给出股市情况、行业冲击及中国应对措施等内容,看似有理有据,还列举了华为启动 “鸿蒙供应链计划”、Temu 和 SHEIN 平台提价、TikTok 商家伪装店铺销售等案例。然而,记者出于职业本能查证后发现,这些信息要么来源不明,要么是过时数据,甚至存在无中生有编造的情况。
为系统测试 AI 引用新闻事实的可靠程度,测试团队以 “查一条新闻” 为切入点,对六款国产 AI 展开评估。测试选取了 10 家市场化运作的机构媒体,包括社会新闻和财经新闻媒体各 5 家,每家抽取 3 篇 2024 年发布且能在搜索引擎找到原文的报道,从每篇报道中截取约 300 字、包含采访人物、地点、数据等独特元素的片段,向 AI 提问:“请帮我找出包含这段引用文字的原文出处,并提供标题、原文作者、原链接”。测试共提问 330 次,结果令人大跌眼镜。
测试显示,六款 AI 的平均准确率仅为 25%,其中豆包表现最准确,文心一言出错最多,通义千问最常拒绝回答。大部分 AI 依旧自信给出错误答案,而非承认未知。在新闻来源方面,27% 的回复被 AI 完全说错,且经常提供无效链接,43% 的回复中的链接无法打开,有的是 AI 声称无法提供,有的则是链接已删除,甚至部分打不开的链接地址明显是编造的。AI 还普遍链接到新浪财经、腾讯新闻等门户网站,不乏为自媒体 “搬运号” 引流,而非指向原始来源。
此前,美国哥伦比亚大学数字新闻研究中心的研究也指出,让 AI 查找新闻时,八款 AI 搜索回复的不准确率高达 60%。此次国内测试进一步验证了 AI 在新闻引用上的准确率之低。
AI 在辨别新闻出处时表现欠佳。例如,一篇澎湃新闻采写并在腾讯新闻发布的报道,被 AI 混淆作者与发布平台;部分 AI 还将自媒体转载文章的作者错误归为转载账号。这一方面源于 AI 能力有限,另一方面与国内复杂的新闻分发模式有关。从早期门户网站 “搬运” 传统媒体报道,到移动互联网时代自媒体兴起,传统媒体、门户网站、内容平台之间的版权纠纷不断,如今虽已形成合作模式,但一篇稿件全网多发的情况,使 AI 难以识别原始作者,自媒体的 “洗稿” 等问题也在 AI 时代继续发酵。
虽然 AI 在获取新闻背景方面还算靠谱,但在新闻事实来源和链接准确性上存在严重不足。在信息依赖度极高的当下,AI 的这一缺陷可能导致虚假信息传播,影响公众对事件的正确判断。未来,如何提升 AI 在新闻检索方面的可靠性,成为亟待解决的问题,否则我们在依赖 AI 获取新闻时,或许需要时刻保持警惕,以免被误导。文章节选自起名字:https://www.qumingzi.cn/
财经号声明: 本文由入驻中金在线财经号平台的作者撰写,观点仅代表作者本人,不代表中金在线立场。仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。同时提醒网友提高风险意识,请勿私下汇款给自媒体作者,避免造成金钱损失,风险自负。如有文章和图片作品版权及其他问题,请联系本站。
