谷歌“Nano Banana”图像生成模型正式商用,新增10种长宽比与批量处理功能

Commenti · 0 Visualizzazioni

谷歌近日宣布,其代号为“Nano Banana”的图像生成模型Gemini 2.5 Flash Image已正式投入商业应用,开始面向企业及开发者提供授权服务。该模型在完成技术优化后,现已通过Gemini App、Google AI Studio、Gemini API及Vertex AI等多平台

  谷歌近日宣布,其代号为“Nano Banana”的图像生成模型Gemini 2.5 Flash Image已正式投入商业应用,开始面向企业及开发者提供授权服务。该模型在完成技术优化后,现已通过Gemini App、Google AI Studio、Gemini API及Vertex AI等多平台开放访问,同时新增图片批量处理功能,进一步提升了创作效率。

  据内部数据显示,自今年8月底该模型开启预览以来,用户参与度远超预期。仅在Gemini AI生态内,基于“Nano Banana”生成的图像作品已突破50亿次,覆盖艺术创作、广告设计、社交媒体内容等多个领域。这一数据印证了市场对多场景图像生成技术的强烈需求。

  商业化方面,谷歌首次公布了定价策略:每100万个输出Token收费30美元(约合人民币214元),按单张图像平均消耗1290个Token计算,生成成本约为0.039美元/张(约合人民币0.28元)。官方强调,该模型已通过安全评估,符合生产环境部署标准,并受商业条款保护,确保用户数据与创作内容的合规性。

  功能升级是此次发布的核心亮点。相较于预览版仅支持16:9单一比例,正式版模型扩展至10种长宽比,包括21:9(电影宽屏)、9:16(竖版短视频)、1:1(社交媒体配图)等,覆盖从影视制作到移动端内容的全场景需求。开发者可通过参数调整,快速适配不同平台的视觉规范,减少后期裁剪的工作量。

  技术团队透露,模型优化重点在于平衡生成质量与计算效率。通过改进注意力机制和分层渲染算法,新版本在保持图像细节的同时,将推理速度提升了30%。批量处理功能支持同时生成多组不同比例的图像,显著提升了商业项目中的内容产出效率。

Commenti