在科技界的一次重大爆料中,据彭博社从内部渠道获悉,DeepSeek公司正秘密研发一款前沿的人工智能代理(AI Agent)大模型。这款模型的最大亮点在于,它能够在用户给出极少量指令的情况下,自主执行多步骤任务,并具备根据用户历史行为自我学习和优化的能力。
DeepSeek的创始人梁文峰正力推团队,争取在今年第四季度将这一创新产品推向市场。这一消息的发布,正值业界对DeepSeek R1版本后续迭代的热切期待之中。今年年初,R1版本的发布在全球科技领域引起了巨大反响。
与众多高调推进的大模型厂商不同,DeepSeek的发展步伐显得尤为稳健且低调。自R1发布后,公司仅推出了数次小幅升级。今年6月,有报道指出,R2版本的推迟发布是因为梁文峰坚持要确保产品的完美无瑕。外界猜测,这或许是因为在训练或开发过程中遇到了一些技术难题。而此次关于新一代智能体模型的计划,此前从未被公开透露,这也体现了DeepSeek在行业趋势中的深思熟虑。
就在8月21日,DeepSeek发布了V3.1版本,虽然是一次小版本更新,但也引起了广泛关注。此次升级引入了混合推理架构,使模型能够同时支持思考模式与非思考模式,显著提升了思考效率和Agent能力。然而,V3.1版本发布后,也因一些bug而被网友调侃。
DeepSeek的这一系列动作,无疑再次展示了其在人工智能领域的深厚积累和持续创新的能力。随着新产品的即将发布,业界对于DeepSeek能否在激烈的市场竞争中脱颖而出,充满了期待。