微软首款自研AI图像生成器MAI-Image-1现已在两款产品中上线——必应图像创作(Bing Image Creator)和Copilot Audio Expressions。该模型于十月正式公布。微软AI负责人Mustafa Suleyman在X(前Twitter)上发布的帖子中表示,这一文本到图像的模型将在欧盟“即将推出”。
Suleyman进一步补充说,该模型在生成食物、自然场景以及富有艺术感的灯光和写实细节方面“表现尤为出色”。
微软此前在官方博客中进一步说明“MAI-Image-1擅长生成写实图像,例如灯光(如反射光、反弹光)、风景等。与许多体积更大、速度更慢的模型相比,它的优势尤为明显。速度与质量的结合使用户能够更快地将创意呈现在屏幕上,快速迭代,并将作品转移至其他工具继续精细化。”
MAI-Image-1还将在Copilot文本转语音平台Copilot Audio Expressions的“故事模式”中,为AI生成的音频故事配备相应的AI艺术图像。
去年八月,微软公布了首批自研AI模型——语音模型MAI-Voice-1与文本模型MAI-1-preview。当时公司表示,计划在某些未具体说明的情境下将MAI-1-preview应用于Copilot AI助理,这被视为微软可能正在逐步摆脱对OpenAI模型的依赖。截止目前,微软称其Copilot聊天机器人正转向使用OpenAI最新的GPT-5,同时向用户提供Anthropic的Claude模型作为备选。
在必应图像创作网站和应用中,MAI-Image-1是三款可供选择的AI模型之一,另外两款模型DALL·E 3和GPT‑4o均来自OpenAI。
