OpenAI近日宣布,旗下ChatGPT聊天机器人正式集成“语音模式”进入主要聊天界面,让用户能在语音对话中即时看到地图、图片等视觉内容以及自动文本转录,提供更顺畅的多模态互动体验。
过去,语音对话是ChatGPT的独立功能,用户需额外切换模式才能使用语音功能。现在新版直接把语音集成进主聊天画面,用户可以一边开口说话、一边看到图表或图片等视觉辅助数据,也能查看系统自动产出的文本转录记录,方便日后查阅对话内容。
OpenAI表示,这项集成大幅提升了互动效率与便利性。例如,当用户用语音询问某个地点,系统不只会以自然语调回应,还会即时在画面中显示对应地地图讯或相关图片。
此外,考虑到有些人偏好纯语音互动,新版本也贴心设计了一个设置开关,让用户可选择回到旧版的纯语音模式,以维持原本的沉浸式体验。
这波更新也是OpenAI积极拓展AI应用边界的最新一步。除了多模态功能,近期OpenAI还陆续推出AI购物助手、支持iCloud钥匙圈的Atlas浏览器功能、群组聊天系统,以及运算性能更强的GPT-5.1模型等新功能,持续深化在消费者市场与企业端的产品布局。
