AWS re:Invent Matt Garman主题演讲 直击重点发布与关键洞察

Mga komento · 1 Mga view

12月3日凌晨12时,2025 AWS re:Invent全球大会进入第二天议程。AWS行政总裁Matt Garman发布题为《AWS如何重塑云计算技术未来》主题演讲,系统阐述创建AI Agent所需四大核心要素:AI基础设施、推理系统、数据、创建工具。他隆重

  12月3日凌晨12时,2025 AWS re:Invent全球大会进入第二天议程。AWS行政总裁Matt Garman发布题为《AWS如何重塑云计算技术未来》主题演讲,系统阐述创建AI Agent所需四大核心要素:AI基础设施、推理系统、数据、创建工具。他隆重发布开创性Amazon Nova 2系列基础模型,以及三大“前沿Agent”:Kiro Autonomous Agent、Amazon Security Agent、Amazon DevOps Agent,并宣布25项云计算核心服务重大创新,进一步拉大技术差距,巩固AWS在全球云计算与AI领域领导地位。

  Matt Garman在演讲开始时,首先阐释他对AI趋势理解。他表示Agentic AI技术正处于关键转折点,从“技术奇迹”转化为能提供实际业务价值实用工具。他预测未来将有数十亿Agent在各行各业广泛运行,协助企业实现10倍效率提升。要让Agent真正发挥作用,需要四大核心要素坚实支持。

  Amazon Trainium芯片系列突破性发展

  Matt Garman宣布正式发布Amazon Trainium 3 UltraServers,这是AWS首款搭载3纳米制程AI芯片服务器。它比Amazon Trainium 2提供4.4倍运算能力、3.9倍内存带宽及5倍每兆瓦AI token处理量。服务器最高配置144个芯片,提供惊人362 petaflops FP8运算能力。在运行OpenAI的GPT-OSS-120B模型时,每兆瓦输出token数是Amazon Trainium 2的5倍以上,实现超高能耗比。

  

  更令人振奋的是,Matt Garman首次公布Amazon Trainium 4芯片,承诺将实现较Amazon Trainium 3六倍FP4运算性能、四倍内存带宽及两倍高内存容量,持续巩固AWS在AI芯片领域长远领先地位。目前AWS已完成超过100万个Trainium 2芯片大规模部署,为Amazon Bedrock中大部分推理工作提供核心算力支持,包括Claude最新一代模型高效运行。

  

  AWS与NVIDIA合作已达15年,是业界最早在云计算提供NVIDIA GPU服务厂商。Matt Garman特别强调,AWS在GPU集群稳定性表现远超行业其他供应商,通过深入细节改良(如Debug BIOS预防GPU重新启动)及对每个问题进行根本原因分析,确保为客户提供业界卓越GPU运行稳定性。新发布P6e-GB300实例搭载NVIDIA最新GB200 NVL72系统,为最具挑战性AI工作负载提供支持。OpenAI在AWS上运行ChatGPT,使用数十万芯片Amazon EC2 Ultra服务器集群,可扩展至超过千万CPU。

  Amazon AI Factories:突破数据主权限制

  受与沙特阿拉伯Neom创业公司合作启发,AWS推出开创性Amazon AI Factories服务。这项服务允许在客户自有数据中心部署AWS专用AI基础设施,运行体验与AWS公有云区域一致,利用客户现有数据中心空间和电力,使用最新Amazon Trainium UltraServers或NVIDIA GPU,使用Amazon SageMaker和Amazon Bedrock服务,同时满足严格合规和数据主权要求。这为无法将数据迁移到云计算客户提供完美解决方案。

  生物技术公司Vialet利用AWS强大AI基础设施训练“科学多面手”AI,已处理数万亿科学推理token,预计未来几年增长100倍。通过AI自主提出假设、设计并运行实验,Vialet正加速药物研发和新材料发现,展示强大AI基础设施如何推动科学突破。

  Amazon Bedrock全面扩展

  Amazon Bedrock协助客户快速将生成式AI应用从原型转为生产环境。Amazon Bedrock用户数量比去年同期增长一倍以上,超过50个客户已处理超过1万亿个token。Amazon Bedrock提供广泛模型选择、基于使用场景特定模型、集成数据工具、添加安全护栏,与AWS现有服务和数据深度集成。

  Matt Garman宣布Amazon Bedrock添加Google Gemma、MiniMax M2、NVIDIA Nemotron、KIMI开源权重模型。同时提供全新发布Mistral 3系列,其参数量增加5倍以上、上下文窗口大小是Large 2两倍的Mistral Large,提供从超高效边缘设备到单GPU部署到高端本地灵活操作。

  

  Amazon Nova 2系列:性价比突破

  Matt Garman隆重发布Amazon Nova 2系列,包括四大模型:

  Amazon Nova 2 Lite:快速、高成本效益推理模型,在指令跟随、工具调用、程序代码生成、文件资讯提取方面表现出色,性能媲美Claude Haiku 3.5、GPT-4o Mini和Gemini 1.5 Flash。

  Amazon Nova 2 Pro:处理高度复杂工作负载智能推理模型,在指令跟随和智能工具使用方面超越GPT-4o、Gemini 1.5 Pro等前沿模型。

  Amazon Nova 2 Sonic:下一代语音到语音模型,提供行业领先对话品质,改良延迟,大幅扩展语言支持。

  Amazon Nova 2 Omni:业界首个真正统一多模态模型,支持文本、图像、视频、音频输入,并支持文本和图像输出。例如可以理解整个会议内容(演讲者语言、演示文稿、视频),生成包含文本和图像摘要。

  

  

  

  

  

  营销内容运营公司Greatdeal面临将创意构思转化为网站内容需4至6星期、涉及20多个步骤和多个专业角色挑战。使用Amazon Bedrock和Amazon Nova创建编排Agent,将不同子Agent(编写、设计、网站等)组合使用,显著加速内容生产流程,提供更高转化率内容。

  第三方模型无法深度适配企业特定业务数据,且企业专有数据不能嵌入公共可用模型。现有解决方案存在明显局限:RAG和矢量数据在推理时提供上下文效果有限;从头创建模型成本高、数据不足、专业知识要求高;微调开放权重模型难以掌握新领域知识,容易“遗忘”之前学到能力。

  Amazon Nova Forge:开创性“开放训练模型”

  Matt Garman宣布推出开创性Amazon Nova Forge,引入“开放训练模型”概念。Amazon Nova Forge提供Amazon Nova训练检查点独家访问,允许在模型训练每个阶段混合企业专有数据与AWS创建训练数据集。产出模型深度理解企业资讯,同时保留核心能力。

  工作流程包括:从80%预训练Amazon Nova 2 Light检查点开始,混合企业数据与AWS训练数据集,使用提供配方完成预训练,使用远程奖励函数和强化微调进一步改良,最后将模型导入Amazon Bedrock运行推理。例如硬件制造商可询问设计A与设计B利弊,获取基于公司历史结果、制造约束和客户偏好具体回答。

  

  Reddit需要在多个安全维度审核聊天和搜索内容。微调现有模型无法达到所需性能,若尝试使用多个模型处理不同安全维度,则过于复杂且无法达到社交媒体特定要求准确度。使用Amazon Nova Forge将专有领域数据集成到预训练阶段后,首次生产出同时满足准确性和成本效益目标专属模型,部署和运营更简单,且自然结合通用语言理解能力和社交媒体特定知识,精准匹配场景需求。

  Sony创建Sony Data Ocean,利用AWS每天处理来自500多个数据源760TB数据。使用Amazon Bedrock创建企业大语言模型,自推出2年来拥有57,000用户,每天处理150,000个推理请求。将Amazon Bedrock AgentCore置于Agentic AI系统中心,轻松管控、部署和管理更有用Agent能力。微调Amazon Nova 2.0 Lite模型,在参考一致性和文件Grounding方面超越基线模型,目标将Sony合规审查和评估流程效率提高100倍。

  Amazon Bedrock AgentCore:全面增强

  Amazon Bedrock AgentCore使企业能够规模化安全创建、部署和运营Agent。在模块化设计理念下,客户可根据需要选择组件。核心组件包括:安全Serverless Runtime(Agent在完全会话隔离中运行)、AgentCore Memory(处理短期和长期记忆)、AgentCore Gateway(Agent轻松发现并安全连接工具、数据和其他Agent)、AgentCore Identity(提供安全身份验证)、AgentCore Observability(实时查看已部署Agent工作流程)、基础工具集(包括程序代码解释器和托管浏览器服务)。

  系统具有高度开放性:支持多种框架(Crew AI、LlamaIndex、LangChain Strands Agent);支持任何模型(Amazon Bedrock模型、OpenAI GPT、Google Gemini等);私有安全部署在Amazon VPC内;扩展至数千个会话;部署迅速,通过拖放几行程序代码实现一分钟内部署。

  AgentCore Policy:实时确定性控制突破

  如何在赋予Agent自主性同时确保可预测行为?AgentCore Policy提供Agent与企业工具和数据互动实时确定性控制。使用自然语言定义策略(如“阻止退款金额超过1,000美元的所有客户退款”),将提示转换为Cedar(基于自动推理开源语言),部署至AgentCore Gateway,以毫秒级速度评估所有Agent操作。在Agent与所有数据、API和工具之间提供策略评估,确保行为可预测可控。

  AgentCore Evaluations:持续品质保障

  AgentCore Evaluations协助开发者持续检查基于真实行为Agent品质。提供13个预览评估器,覆盖常见品质维度;支持创建自订评分系统;在测试阶段评估Agent,在部署前纠正问题;在生产环境中快速发现品质下降。结果显示在CloudWatch中,自动化专业知识和基础设施繁重工作,让所有人都能访问并持续改良Agent品质。

  

  

  

  

  AI Agent能够代表人执行任务并进行自动化工作。这正是我们开始看到AI投资带来实质性商业回应地方。Matt Garman说:“我相信AI Agent出现已经将我们带到AI发展轨迹拐点——它正在从技术奇迹转化为能够提供真正价值东西”。

  这变化将对业务产生与互联网或云计算同等影响。Matt Garman指出:“我相信在未来,每家公司内部将有数十亿个Agent,遍布各个可以想象领域。我们已看到Agent在加速医疗保健发现、改善客户服务、提高薪金处理效率方面应用。在某些情况下,Agent已经开始将人们影响力扩大十倍”。

  

  要真正发挥Agent价值,我们需要具有全面能力公司级AI工具支持。他重点介绍两项关键工具:

  1. 公司级AI工具全面能力

  Amazon Quick:公司级AI助手实现10倍效率提升

Amazon Quick期望能为每个员工提供他们在消费级AI中已经开始接受那种体验,但配备公司所需上下文、数据和安全性。其关键重点是全面数据集成能力,集成结构化数据(BI数据、数据库、数据存储)、应用程序数据(Microsoft 365、Jira、ServiceNow、HubSpot、Salesforce)、非结构化数据(个人文件、SharePoint文件、Google Drive、Box文件等)。

Amazon Quick提供三大核心功能:丰富BI(商业智能)能力,轻松跨所有结构化和非结构化数据源发现洞察;深度研究功能,调查复杂主题,从内部数据存储库和互联网外部源收集资讯,生成详细研究报告;Quick Flows,创建个人小型Agent,自动化日常重复任务,提高个人和团队效率。

几个月前,AWS在内部发布Amazon Quick Suite,如今已有数十万用户。团队称他们完成任务时间是原来十分之一。AWS税务团队创建一个Amazon Quick Agent,协助他们集成所有税务数据来源、获取税务项目数据、审计数据、互联网上细节,对任何税法或政策变更执行深度研究,并在单一视图中呈现所有这些税务资讯——这些都是非开发人员做的,他们无需编写任何程序代码或手动拉取任何报告就能做到。

Amazon Transform Custom:消除技术债开创性工具

技术债每年在美国产成约2.4兆美元成本,70% IT预算用于维护遗留系统。Amazon Transform Custom让客户能够创建特定程序代码转换Agent,以现代化任何程序代码、API、框架或Runtime,甚至包括仅在公司内部使用程序语言或框架。云计算ERP解决方案提供商QAD使用Amazon Transform后,原本至少需要2星期完成转换工作在不到3天内完成,显著加速客户现代化进程。

2. 三大前沿Agent:开发者工具开创性突破

改变每个人业务最大机遇之一就是Agent。Agent令人兴奋,因为它们可以采取行动并完成任务。它们可以动态推理,并以最佳方式创建工作流程来解决问题,而无需预先程序设计。前沿Agent具有三个关键特征:自主性(朝目标前进并自行决定如何实现)、大规模可扩展(单个Agent可执行多任务,同时支持跨多个实例分配工作)、长时间运行(可工作数小时甚至数天,无需人手干预)。

Kiro Autonomous Agent:变革软件开发方式

Kiro Autonomous Agent变革开发者和团队创建软件方式,大幅提升开发能力。它与开发流程并行运行,保持上下文并自动化开发任务。自主完成从功能交付到错误分类到改良程序代码覆盖率全部工作。与Jira、GitHub、Slack等现有工具连接。学习团队工作方式,持续加深对程序代码、产品和团队标准理解。

在跨库更新场景中,传统方式需要在15个不同微服务中逐一打开程序代码库,提示更新、审查更改、运行测试、创建Pull Request。Kiro方式:在kiro.dev启动与GitHub关联任务,描述问题后Agent提出澄清问题并规划任务,利用对整个程序代码库了解识别需要更新所有位置,分析每个服务如何使用库,遵循现有模式更新程序代码,运行测试并打开15个经过测试、准备整合Pull Request。内部案例显示6人团队在76天内完成原计划30人18个月项目。

Amazon Security Agent:从设计阶段创建安全应用

从设计阶段开始创建安全应用,在加速开发同时确保安全性。主动审查设计文件,在编写程序代码前发现安全问题。识别程序代码中漏洞。直接集成GitHub Pull Request,在开发工作流程中提供反馈。将缓慢昂贵渗透测试转变为按需实践。避免因安全问题导致程序代码重写,无需昂贵外部顾问,允许更频繁地进行安全验证。

Amazon DevOps Agent:主动预防运营事件

解决和主动预防事件,持续提高可靠性和性能。像经验丰富DevOps工程师一样调查事件并识别运营改良。从资源、关系、现有可观察性解决方案、操作手册、程序代码库和CI/CD流程学习。关联所有来源遥测、程序代码和部署数据。在身份验证错误处理场景中,当警报触发显示Lambda函数连接数据库时身份验证错误率升高,DevOps Agent在值班工程师查看前立即响应,诊断问题,利用应用程序拓扑知识和组件关系理解追溯警报找出根本原因,确定问题是Lambda函数IAM策略变更导致,找出引入变更CDK程序代码部署,提出修复并准备供值班工程师审批,推荐CI/CD护栏防止类似问题再次发生。

这些前沿Agent正将AI从技术展示转变为真正生产力工具,协助企业实现10倍效率提升,迎接AI Agent时代无限可能。

延续AWS“构建单元”理念,Matt Garman快速发布25项云计算核心服务创新,覆盖运算、存储、数据库等领域:

Matt Garman展示AWS惊人业务成就:达到1,320亿美元规模,同比增长20%(过去12个月增长约220亿美元,超过财富500强一半企业年收入);Amazon S3存储超过500万亿个对象,每秒处理超过2亿次请求;超过一半CPU容量来自Amazon Graviton处理器;Amazon Bedrock服务10万家公司,超过50个客户已处理超过1万亿个token;Amazon Bedrock AgentCore SDK下载量超过200万次。

Matt Garman总结道,我们正处于一个前所未有时代,AI Agent技术将彻底改变企业运营方式。AWS通过从芯片到模型到Agent全栈式创新,为客户提供创建AI Agent所需四大核心要素。

随着Kiro Autonomous Agent、Amazon Security Agent和Amazon DevOps Agent——这三大前沿Agent问世,开发者将获得前所未有生产力提升。配合25项云计算核心服务重大创新,AWS正协助客户获得AI真正价值。随着数十亿Agent在各行各业运行,企业将实现10倍效率提升,迎接AI Agent时代无限可能。

Mga komento
会员免费服务:时刻音乐 时刻云盘 时刻工具箱 时刻标签 GitHub加速 时刻工具