How Microsoft thinks about AGI

这是一份对萨提亚·纳德拉(Satya Nadella)访谈内容的完整翻译,内容围绕微软对通用人工智能(AGI)的思考、大规模基础设施建设、商业模式转型以及全球主权AI竞争等核心话题展开。




萨提亚·纳德拉访谈内容:微软对通用人工智能的思考


本访谈是与微软首席执行官萨提亚·纳德拉(Satya Nadella)进行的,采访者为德瓦克什·帕特尔(Dwarkesh Patel)和 SemiAnalysis 创始人迪伦·帕特尔(Dylan Patel)。纳德拉和微软云计算与人工智能执行副总裁斯科特·格斯里(Scott Guthrie)带领采访者参观了全新的 Fairwater 2 数据中心,该中心目前是世界上最强大的数据中心。


一、 基础设施与扩展规模


纳德拉指出,微软的目标是每 18 到 24 个月将训练能力提高 10 倍


巨大的扩展规模: 目前正在建设的设施规模巨大。该建筑中的网络光学元件数量几乎等同于两年半前 Azure 所有数据中心的光学元件总量。它拥有大约 500 万个网络连接。
计算能力: 这一容量相当于 GPT-5 训练所用资源的 10 倍增长
训练目标: 目标是能够将这些浮点运算能力(flops)聚合起来,用于大型训练作业。这些资源不仅用于训练,还将用于数据生成和推理。
超高速网络: Fairwater 4(正在附近建设中)也将连接到相同的 1 PB(千万亿位)网络,以便将两个设施以极高的速率连接起来。微软还通过 AI 广域网(WAN)连接到威斯康星州的密尔沃基,那里正在建设多个 Fairwater 设施。
聚合作业: 这种架构是为超级训练集群(super pods)设计的,可以聚合所有这些资源来运行训练作业,实现模型并行和数据并行。

纳德拉强调,他们不希望将所有基础设施都建在一个规范上。鉴于未来芯片(如 Vera Rubin Ultra)的功耗密度和冷却要求会截然不同,他们的战略是随着时间推移进行扩展,而不是一次性扩展然后被困住。


二、 技术革命、AGI与经济影响


纳德拉表示,他赞同 AI 可能是自工业革命以来最大的事件这一观点。


加速的革命: 过去的每一次技术转型(铁路、互联网、工业化、云计算)从被发现到普及的速度都在加快。本轮 AI 革命的速度是空前的;明年超大规模厂商的资本支出将达到 5000 亿美元。
早期的阶段: 尽管如此,纳德拉认为目前仍处于早期阶段。他乐观地认为扩展法则将继续有效,但这需要科学突破和大量的工程工作。
AI 的定义: 纳德拉引用图灵奖得主拉杰·雷迪(Raj Reddy)的比喻:AI 应该是“守护天使”(guardian angel)“认知放大器”(cognitive amplifier)。纳德拉倾向于将 AI 视为工具。
经济扩散: 工业革命在扩散 70 年后才开始看到经济增长。对于 AI 而言,即使技术扩散速度很快,但真正的经济增长只有在工作、工作产物和工作流程发生改变时才会出现。这需要企业进行变革管理。
杠杆作用: 新技术将使人类的杠杆作用(生产力)增加,甚至可能实现 10 倍的提升。他希望将工业革命 200 年间发生的事情压缩到 20 到 25 年内实现。

三、 商业模式转型:高 COGS 的挑战


传统的软件即服务(SaaS)模式具有极低的增量用户成本。但 AI 的销售成本(COGS)极高,这彻底颠覆了传统的 SaaS 商业模式。


微软的对策: 纳德拉认为商业模式的杠杆将保持类似:广告、交易、设备毛利率、订阅和消耗量(consumption)。订阅本质上是某种消耗权(consumption rights)的授权
市场扩大: 就像当年从服务器转向云计算极大地扩大了市场(例如,印度用户可以负担得起部分服务器成本)一样,纳德拉预测 AI 也将极大地扩大市场
编码市场竞争: 像 GitHub Copilot 这样的编码助手市场在一年内实现了巨大增长。据估计,GitHub Copilot 的年收入在年初约为 5 亿美元,而现在,包括 Claude Code、Cursor 和 Codex 在内的整个 AI 编码市场的年运行率已达到 50 亿至 60 亿美元,实现了 10 倍增长。

四、 竞争优势、模型与脚手架(Scaffolding)


面对竞争,纳德拉承认,微软在编码助手的市场份额在一年内从接近 100% 下降到 25% 以下。他强调,没有与生俱来的权利,公司必须不断创新。


市场比份额重要: 即使微软的市场份额可能不如过去强大,但只要其竞争的市场(如超大规模计算)创造的价值更大,其业务仍将增长。
GitHub 的平台优势: 无论哪个编码代理胜出,GitHub 仍将持续增长,因为所有竞争者的代码仓库都在 GitHub 上。GitHub 在代码库创建和 PR 方面处于历史最高水平。
Agent HQ 创新: 微软正在扩展 GitHub 的基础能力(Git、issues、actions),计划推出 Agent HQ(代理总部)。纳德拉将其描述为 AI 代理的“有线电视”。该平台将把 Codex、Claude、Cognition、Grok 等多个代理捆绑在一个订阅中,允许用户发布任务、引导它们在独立分支中自主工作,并提供所需的可观察性(observability)。
模型商品化辩论: 纳德拉认为,随着开源模型的发展,模型本身可能成为商品。因此,如果微软赢得脚手架(处理智能的“粗糙”问题、数据流动性和上下文工程),他们就能主导市场,甚至可以利用开源模型或可用的检查点进行垂直整合。
模型与应用整合: 微软的策略是将模型深度整合到应用中,而非仅仅是用户界面包装器。例如,Excel Agent 并非只是一个 UI 级别的包装,而是一个位于中间层的模型,它被教授如何“原生”理解 Excel 的所有构件(如公式),从而在其传统业务逻辑上包裹一层认知层
竞争制约: 只要市场上存在竞争(如超大规模竞争)和开源制衡,模型定价过高就会导致工具构建者转向替代模型。

五、 LLM 作为自治代理的未来


未来的模型将能够像人类一样使用计算机,查看公式、使用替代软件并在平台间迁移数据。纳德拉将微软的未来业务描述为两个世界:


1.工具业务: 人类操作,使用 Copilot 和代理。
2.自治代理: 公司为完全自主工作的 AI 代理提供计算资源。

基础设施转型: 微软的最终用户工具业务将转变为支持代理工作的底层基础设施业务。M365 下方的所有系统(存储、存档、发现、身份管理)对于 AI 代理来说仍然至关重要。
按代理收费: 鉴于自治代理需要配置一台计算机,未来的按用户(per-user)业务将演变为按用户加按代理(per-agent)的业务,并且代理数量的增长将快于用户数量的增长。
混合世界与迁移: AI 在未来几年的最大价值驱动力是系统迁移(将基于主机/Excel/Word的系统转换为更具编程性和效率的云标准系统)。然而,未来将是一个混合世界,人类和代理必须协同工作和交互。即使在纯粹的代理工作环境中,也需要基础设施原语,如存储系统(具备电子取证能力)、可观察性和统一的身份系统。

六、 微软 AI(MAI)与 OpenAI 的战略


纳德拉指出,微软将继续在各个产品中最大限度地利用 OpenAI 模型长达七年,并在其基础上增加价值。


GPT 系列加持: 微软拥有 GPT 系列的 IP 权利,可以进行 RL 微调和使用其独有数据资产进行中途训练,从而构建能力。
MAI 聚焦高价值: 微软正在组建一个世界级的超智能团队(包括 Mustafa、Karen、Amar Subramanya 等顶尖人才)。他们致力于避免重复工作,将 MAI 的资源(flops)用于成本优化和专业模型。
专业模型发展: MAI 已推出图像模型(在图像竞技场中排名第九)和音频模型。下一阶段将是全能模型(omni-model),结合音频、图像和文本工作。
人才与研发: 纳德拉承认 AI 人才竞争激烈且资本密集。他将对计算基础设施的投资视为研发费用(R&D expense),这对于保持领先地位至关重要。
对 OpenAI 系统的访问权: 微软拥有 OpenAI 系统层面的 所有 IP 访问权,除了消费者硬件部分。
API 独占权: 微软与 OpenAI 的合作协议中,OpenAI 的 PaaS 业务(API 业务)对 Azure 具有独占性。这意味着任何希望使用 OpenAI 的无状态 API 调用的合作伙伴都必须在 Azure 上运行。

七、 资本支出暂停与竞争策略


微软在 2023 年下半年暂停了部分大规模租赁和建设,这使得其他公司(Google、Meta、Oracle)获得了这些场地。


暂停原因:

1. 舰队互换性(Fungibility): 关键在于需要整个计算集群在 AI 的所有阶段都具备可互换性。

2. 避免世代锁定: 他们不想被困在某一特定代次的硬件中,因为下一代芯片(GB200s, Vera Rubin)将彻底改变数据中心的结构和冷却需求。

3. 商业逻辑: 他们不希望仅仅成为一个模型公司的代管商(hoster),因为这不符合微软的超大规模业务模式。微软的业务是服务于 AI 工作负载的长尾客户

市场定位: 微软专注于长尾 AI 工作负载的超大规模业务。真正的 AI 工作负载需要的不仅仅是对模型的 API 调用,还需要数据库、存储和计算等一切基础设施,而这正是 Azure Foundry 所提供的。
工业化业务: 纳德拉将微软描述为资本密集型和知识密集型的业务。软件能力(知识密集度)对于优化工作负载、提高资本效率至关重要。

八、 主权 AI 与全球信任


面对一个多极化的世界,许多国家(包括欧洲和印度)正在推动主权 AI 建设。


美国科技的责任: 纳德拉认为美国技术部门的首要任务是不仅进行领先的创新工作,还要在全球范围内建立对美国技术栈的信任。美国占据全球 50% 的市值,源于世界对美国的信任。
微软的策略: 微软通过技术和政策来建立这种信任。他们向欧盟做出承诺,并在法国、德国等地建设主权云,提供 Azure 主权服务(Sovereign Services),包括机密计算。
抵抗集中化风险: 纳德拉认为,开源将始终存在,作为对单一模型主导地位的制衡。每个国家都会希望拥有多个模型,以避免集中化风险。
信任战: 面对来自中国公司的竞争(如字节跳动、阿里巴巴、Deepseek 等),纳德拉认为,最终决定胜负的关键可能不是模型能力,而是信任——“我能相信你、你的公司和你的机构是长期的供应商吗?”。
弹性优先: 鉴于全球从疫情中吸取了教训,各国现在将弹性(resilience)置于纯粹的效率之上。微软作为跨国公司,必须将各国对主权、数据驻留和隐私的合法关切视为构建其软件和物理工厂的一流需求