谷歌Gemini 2.5 Deep Think发布:多智能体推理引领AI新高度,IMO金牌实力见证

コメント · 9 ビュー

谷歌近日宣布,其最新研发的人工智能模型Gemini 2.5 Deep Think在国际数学奥林匹克(IMO)2025竞赛中大放异彩,成功夺得金牌。这款被谷歌誉为“满血版”的智能模型,不仅在数学领域展现了卓越的能力,还标志着谷歌在AI

  谷歌近日宣布,其最新研发的人工智能模型Gemini 2.5 Deep Think在国际数学奥林匹克(IMO)2025竞赛中大放异彩,成功夺得金牌。这款被谷歌誉为“满血版”的智能模型,不仅在数学领域展现了卓越的能力,还标志着谷歌在AI技术上的又一重大突破。

  据悉,Gemini 2.5 Deep Think的核心创新在于其“多智能体推理”机制。这一机制允许模型并行生成多个智能体,每个智能体独立进行推理,最终从中筛选出最优答案。尽管这种方法对计算资源的要求更高,但它显著提升了AI推理的准确性和效率。

  谷歌表示,Gemini 2.5 Deep Think是其首个向公众开放的多智能体模型。在此之前,该模型的一个变体已经参加了IMO 2025竞赛,并凭借出色的表现赢得了金牌。这一成就不仅验证了Gemini 2.5 Deep Think在数学领域的实力,也为其在商业和学术领域的应用奠定了坚实的基础。

  除了数学竞赛的辉煌战绩,Gemini 2.5 Deep Think在多项基准测试中也表现出色。在Humanity’s Last Exam(HLE)中,它取得了34.8%的高分,远超xAI的Grok 4和OpenAI的o3。在代码挑战LiveCodeBench6上,Gemini 2.5 Deep Think同样以87.6%的优异成绩领先其他竞争对手。

  Gemini 2.5 Deep Think还具备强大的工具整合和响应增强能力。它能够自动配合代码执行和谷歌搜索等工具,生成比传统AI模型更长的回复。这一特点使得Gemini 2.5 Deep Think在日常使用和学术研究中更加便捷和高效。

  在功能方面,Gemini 2.5 Deep Think支持多种输入类型,包括文本、图像、音频和视频。其上下文窗口长度最大可接受100万tokens,输出文本形式内容的最大长度可达192Ktokens。这些特性使得Gemini 2.5 Deep Think能够处理更加复杂和多样的任务。

  值得注意的是,在GPT-5发布前夕,谷歌率先推出了Gemini 2.5 Deep Think。这一举动无疑加剧了AI领域的竞争态势。然而,谷歌对Gemini 2.5 Deep Think的信心显而易见,他们相信这款模型能够在未来继续引领AI技术的发展潮流。

  对于用户而言,Gemini 2.5 Deep Think的推出意味着他们将有更多选择来应对日益复杂的AI需求。无论是学术研究、商业应用还是日常生活,Gemini 2.5 Deep Think都将为用户提供更加智能和高效的解决方案。

コメント