英特尔全面拥抱开放式异构AI架构，将推新一代数据中心GPU

　　芯片大厂英特尔（Intel）在2025 OCP高峰会上宣布其AI策略，强调将以全面“开放式方法”加倍投入AI领域，应对当前产业正经历的重大转型。英特尔指出，AI是数十年才会发生一次的巨大颠覆。该公司的目标是与整个产业和生态系统伙伴合作，共同打造开放、模块化且可扩展的AI平台，以提供所需规模，实现AI的货币化，并转变日常生活及商业运行。

聚焦推论与代理智能，实现投资货币化

　　英特尔在大会演讲中明确表示，其严苛的聚焦策略将着重于特定的工作负载，即“推论”和“代理智能”（Agentic AI）。英特尔坚信，数千亿美元的AI投资将通过代工智能实现货币化，此类智能体将转变企业的运营方式和人们的日常生活。

　　英特尔指出，目前产业对tokens的需求正以惊人的速度增长。云计算服务大厂近期报告显示，每月处理的代币量已达1.4千兆（quadrillion）个，在一年多的时间里增长了100倍以上。这种爆炸性的指数增长代表着业界迫切需要解决“token经济学”问题，思考如何有效且大规模地提供情报和服务。

批判垂直集成架构，呼吁异构开放系统

　　然而，当前的AI应用（如聊天机器人）大多部署在同质化、垂直集成的系统上，并依赖专有网络和软件。英特尔认为，这种现行架构无法有效扩展。而且，代理智能涉及多个模型、工具调用、数据处理和环境/沙箱需求（例如虚拟机或API调用），导致产生的代币数量可能增加两到三个数量级。

　　代工智能工作负载极为多样化。例如，即使是单一的大型语言模型推论调用，也包含“预填充”和“解码”两个阶段。预填充需要计算优化的加速器，而解码则需要内存带宽优化的GPU。此外，代理智能体还需要CPU来处理环境运行（如编码代理测试代码）、工具调用以及安全防护。而由于每个组件对计算、内存带宽和网络都有不同的要求，英特尔主张“一体适用”的同质化垂直集成架构不再适用。业界真正需要的是一个更灵活、开放且异构的基础设施。

统一堆栈与协调的软件为异构性关键

　　英特尔指出，实现这种灵活性和异构性的关键挑战在于软件。软件必须能够隐藏底层异构性的复杂性，为应用程序和开发人员提供零摩擦的体验。因此，英特尔正在创建一个统一的软件堆栈、编译器和协调基础设施，目标是让开发人员无需更改代码，无论他们使用PyTorch、Hugging Face还是LangChain进行开发，应用程序都能“正常运行”。该系统将负责剖析代工智能的工作负载，将不同的组件放置在正确的硬件类型上，并协调起来以实现端到端服务级别协议（SLA）。英特尔预计，将于2025年第四季推出此类基础设施。

　　英特尔与合作伙伴已经进行了基准测试，展示了开放系统架构的优势。他们将Nvidia GPU系统（用于计算优化的预填充部分）与英特尔加速器系统（用于内存带宽优化的解码部分）通过以太网络连接。这种简单的异构系统组合，在相同工作负载下，相比同质化垂直集成系统，提供了至少1.7倍的每美元性能优势。

新时代数据中心GPU-Crescent Island 2026年送样

　　而除了软件方面的努力，英特尔也将持续在底层硬件上进行创新，以提供更多选择。英特尔宣布推出下一代数据中心GPU，代号为“Crescent Island”。这款GPU的重点是推论和代理智能的优化，旨在提供最佳的代币经济效益和每美元性能。

　　英特尔强调， Crescent Island这下一代数据中心GPU采用通用可编程GPU IP XC3 IB构建，将具备低功耗特性，搭载LPDDR内存，并在内存容量和带宽方面实现良好平衡。另外，该GPU针对“预填充”工作负载进行了优化，具备恰到好处的计算优化和内存容量/带宽组合，预计的上市进程是在2026年下半年开始送样。

　　此外，CPU在代工智能工作负载中继续扮演关键角色。英特尔强调x86作为主流CPU平台的重要性。英特尔正积极与AMD和众多伙伴在“x86生态系统咨询小组”中进行开放合作，以推动x86生态系统的标准化和兼容性，例如在中断处理和矢量指令（AV extend）方面的标准化。因此，英特尔重申对开放式以太网络标准化技术的支持，这对于将所有不同组件拼接成优化的机架至关重要。英特尔积极参与OCP及其“开放AI系统”相关工作。

　　(首图来源：pixabay)