ChatGPT支持语音与文本集成互动，OpenAI多模态新功能正式上线

　　OpenAI近日宣布，旗下ChatGPT聊天机器人正式集成“语音模式”进入主要聊天界面，让用户能在语音对话中即时看到地图、图片等视觉内容以及自动文本转录，提供更顺畅的多模态互动体验。

　　过去，语音对话是ChatGPT的独立功能，用户需额外切换模式才能使用语音功能。现在新版直接把语音集成进主聊天画面，用户可以一边开口说话、一边看到图表或图片等视觉辅助数据，也能查看系统自动产出的文本转录记录，方便日后查阅对话内容。

　　OpenAI表示，这项集成大幅提升了互动效率与便利性。例如，当用户用语音询问某个地点，系统不只会以自然语调回应，还会即时在画面中显示对应地地图讯或相关图片。

　　此外，考虑到有些人偏好纯语音互动，新版本也贴心设计了一个设置开关，让用户可选择回到旧版的纯语音模式，以维持原本的沉浸式体验。

　　这波更新也是OpenAI积极拓展AI应用边界的最新一步。除了多模态功能，近期OpenAI还陆续推出AI购物助手、支持iCloud钥匙圈的Atlas浏览器功能、群组聊天系统，以及运算性能更强的GPT-5.1模型等新功能，持续深化在消费者市场与企业端的产品布局。