英特尔全面拥抱开放式异构AI架构,将推新一代数据中心GPU

Kommentarer · 0 Visninger

芯片大厂英特尔 (Intel) 在2025 OCP高峰会上宣布其AI策略,强调将以全面“开放式方法”加倍投入AI领域,应对当前产业正经历的重大转型。英特尔指出,AI是数十年才会发生一次的巨大颠覆。该公司的目标是与整个产业

  

  芯片大厂英特尔 (Intel) 在2025 OCP高峰会上宣布其AI策略,强调将以全面“开放式方法”加倍投入AI领域,应对当前产业正经历的重大转型。英特尔指出,AI是数十年才会发生一次的巨大颠覆。该公司的目标是与整个产业和生态系统伙伴合作,共同打造开放、模块化且可扩展的AI平台,以提供所需规模,实现AI的货币化,并转变日常生活及商业运行。

聚焦推论与代理智能,实现投资货币化

  英特尔在大会演讲中明确表示,其严苛的聚焦策略将着重于特定的工作负载,即“推论”和“代理智能”(Agentic AI)。英特尔坚信,数千亿美元的AI投资将通过代工智能实现货币化,此类智能体将转变企业的运营方式和人们的日常生活。

  英特尔指出,目前产业对tokens的需求正以惊人的速度增长。云计算服务大厂近期报告显示,每月处理的代币量已达1.4千兆 (quadrillion) 个,在一年多的时间里增长了100倍以上。这种爆炸性的指数增长代表着业界迫切需要解决“token经济学”问题,思考如何有效且大规模地提供情报和服务。

批判垂直集成架构,呼吁异构开放系统

  然而,当前的AI应用 (如聊天机器人) 大多部署在同质化、垂直集成的系统上,并依赖专有网络和软件。英特尔认为,这种现行架构无法有效扩展。而且,代理智能涉及多个模型、工具调用、数据处理和环境/沙箱需求 (例如虚拟机或API调用),导致产生的代币数量可能增加两到三个数量级。

  代工智能工作负载极为多样化。例如,即使是单一的大型语言模型推论调用,也包含“预填充”和“解码”两个阶段。预填充需要计算优化的加速器,而解码则需要内存带宽优化的GPU。此外,代理智能体还需要CPU来处理环境运行 (如编码代理测试代码)、工具调用以及安全防护。而由于每个组件对计算、内存带宽和网络都有不同的要求,英特尔主张“一体适用”的同质化垂直集成架构不再适用。业界真正需要的是一个更灵活、开放且异构的基础设施。

统一堆栈与协调的软件为异构性关键

  英特尔指出,实现这种灵活性和异构性的关键挑战在于软件。软件必须能够隐藏底层异构性的复杂性,为应用程序和开发人员提供零摩擦的体验。因此,英特尔正在创建一个统一的软件堆栈、编译器和协调基础设施,目标是让开发人员无需更改代码,无论他们使用PyTorch、Hugging Face还是LangChain进行开发,应用程序都能“正常运行”。该系统将负责剖析代工智能的工作负载,将不同的组件放置在正确的硬件类型上,并协调起来以实现端到端服务级别协议 (SLA)。英特尔预计,将于2025年第四季推出此类基础设施。

  英特尔与合作伙伴已经进行了基准测试,展示了开放系统架构的优势。他们将Nvidia GPU系统 (用于计算优化的预填充部分) 与英特尔加速器系统 (用于内存带宽优化的解码部分) 通过以太网络连接。这种简单的异构系统组合,在相同工作负载下,相比同质化垂直集成系统,提供了至少1.7倍的每美元性能优势。

新时代数据中心GPU-Crescent Island 2026年送样

  而除了软件方面的努力,英特尔也将持续在底层硬件上进行创新,以提供更多选择。英特尔宣布推出下一代数据中心GPU,代号为“Crescent Island”。这款GPU的重点是推论和代理智能的优化,旨在提供最佳的代币经济效益和每美元性能。

  英特尔强调, Crescent Island这下一代数据中心GPU采用通用可编程GPU IP XC3 IB构建,将具备低功耗特性,搭载LPDDR内存,并在内存容量和带宽方面实现良好平衡。另外,该GPU针对“预填充”工作负载进行了优化,具备恰到好处的计算优化和内存容量/带宽组合,预计的上市进程是在2026年下半年开始送样。

  此外,CPU在代工智能工作负载中继续扮演关键角色。英特尔强调x86作为主流CPU平台的重要性。英特尔正积极与AMD和众多伙伴在“x86生态系统咨询小组”中进行开放合作,以推动x86生态系统的标准化和兼容性,例如在中断处理和矢量指令 (AV extend) 方面的标准化。因此,英特尔重申对开放式以太网络标准化技术的支持,这对于将所有不同组件拼接成优化的机架至关重要。英特尔积极参与OCP及其“开放AI系统”相关工作。

  (首图来源:pixabay)

Kommentarer