京东集团段楠:现在的大语言模型像一个“闭着眼睛的智者” | 和讯2025年会
12月7日,京东集团副总裁段楠表示,目前,AI的多模态技术方向,处在方兴未艾的阶段,涉及到端到端的场景,随着多模态对于视觉、语言的理解,推理和生成的结果越来越佳,并产生颠覆性影响。例如在推荐系统上,更加千人千面,教育将变得更为因材施教,娱乐则更开放有趣。

不过,段楠也认为,当下的多模态综合研究还存在一些挑战。首先,语言文字仍是当下的载体和核心,基于语言的学习速度快。但在视觉智能方向,还处于爬坡山上坎的阶段,视觉要理解世界以及背后的常识和规律,还需要进一步地对齐。因此现如今世界模型很火,如果哪个企业可以做到,就是小小的“上帝”。
此外,现在的大语言模型像一个“闭着眼睛的智者”,想让其睁开眼睛的时刻,会有跷跷板效应,语言输出会出现部分“降智”,因此加强其逻辑推理能力,是未来多模态的重要研究方向。
最后,未来人工智能将从数字世界走向物理世界,一定要基于辅助硬件和真实的环境产生交互,如何持续不断提供辅助,完成危险和重复的任务,解放人类,这也是目前研究的关键。
12月7日,由联办集团、和讯共同主办、财经中国会承办,主题为“寻找中国经济破局之路”的和讯财经中国2025年会暨第23届财经风云榜在北京举行。段楠在大会演讲中表达了上述观点。
财经号声明: 本文由入驻中金在线财经号平台的作者撰写,观点仅代表作者本人,不代表中金在线立场。仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。同时提醒网友提高风险意识,请勿私下汇款给自媒体作者,避免造成金钱损失,风险自负。如有文章和图片作品版权及其他问题,请联系本站。
