京东集团段楠:现在的大语言模型像一个“闭着眼睛的智者” | 和讯2025年会

Komentari · 3 Pogledi

12月7日,京东集团副总裁段楠表示,目前,AI的多模态技术方向,处在方兴未艾的阶段,涉及到端到端的场景,随着多模态对于视觉、语言的理解,推理和生成的结果越来越佳,并产生颠覆性影响。例如在推荐系统上,更

  12月7日,京东集团副总裁段楠表示,目前,AI的多模态技术方向,处在方兴未艾的阶段,涉及到端到端的场景,随着多模态对于视觉、语言的理解,推理和生成的结果越来越佳,并产生颠覆性影响。例如在推荐系统上,更加千人千面,教育将变得更为因材施教,娱乐则更开放有趣。

  

    不过,段楠也认为,当下的多模态综合研究还存在一些挑战。首先,语言文字仍是当下的载体和核心,基于语言的学习速度快。但在视觉智能方向,还处于爬坡山上坎的阶段,视觉要理解世界以及背后的常识和规律,还需要进一步地对齐。因此现如今世界模型很火,如果哪个企业可以做到,就是小小的“上帝”。

    此外,现在的大语言模型像一个“闭着眼睛的智者”,想让其睁开眼睛的时刻,会有跷跷板效应,语言输出会出现部分“降智”,因此加强其逻辑推理能力,是未来多模态的重要研究方向。

    最后,未来人工智能将从数字世界走向物理世界,一定要基于辅助硬件和真实的环境产生交互,如何持续不断提供辅助,完成危险和重复的任务,解放人类,这也是目前研究的关键。

    12月7日,由联办集团、和讯共同主办、财经中国会承办,主题为“寻找中国经济破局之路”的和讯财经中国2025年会暨第23届财经风云榜在北京举行。段楠在大会演讲中表达了上述观点。

Komentari
会员免费服务:时刻音乐 时刻云盘 时刻工具箱 时刻标签 GitHub加速 时刻工具