京东集团段楠：现在的大语言模型像一个“闭着眼睛的智者”

　　12月7日，京东集团副总裁段楠表示，目前，AI的多模态技术方向，处在方兴未艾的阶段，涉及到端到端的场景，随着多模态对于视觉、语言的理解，推理和生成的结果越来越佳，并产生颠覆性影响。例如在推荐系统上，更加千人千面，教育将变得更为因材施教，娱乐则更开放有趣。

　　　　不过，段楠也认为，当下的多模态综合研究还存在一些挑战。首先，语言文字仍是当下的载体和核心，基于语言的学习速度快。但在视觉智能方向，还处于爬坡山上坎的阶段，视觉要理解世界以及背后的常识和规律，还需要进一步地对齐。因此现如今世界模型很火，如果哪个企业可以做到，就是小小的“上帝”。

　　　　此外，现在的大语言模型像一个“闭着眼睛的智者”，想让其睁开眼睛的时刻，会有跷跷板效应，语言输出会出现部分“降智”，因此加强其逻辑推理能力，是未来多模态的重要研究方向。

　　　　最后，未来人工智能将从数字世界走向物理世界，一定要基于辅助硬件和真实的环境产生交互，如何持续不断提供辅助，完成危险和重复的任务，解放人类，这也是目前研究的关键。

　　　　12月7日，由联办集团、和讯共同主办、财经中国会承办，主题为“寻找中国经济破局之路”的和讯财经中国2025年会暨第23届财经风云榜在北京举行。段楠在大会演讲中表达了上述观点。

京东集团段楠：现在的大语言模型像一个“闭着眼睛的智者” | 和讯2025年会