AI Agent 生态速报 | 2026-06-03:Foundry 三层生产化落地,Anthropic 递交 IPO,Nemotron 550B 明日上线

AI Agent 生态速报 | 2026-06-03:Foundry 三层生产化落地,Anthropic 递交 IPO,Nemotron 550B 明日上线

Build 2026 Day 2:微软 Foundry 三层生产化体系(Build/Deploy/Operate)落地,Scout 成为首个 Autopilot Agent;Anthropic 向 SEC 递交保密 S-1,年化营收 $47B;NVIDIA Nemotron 3 Ultra 550B 明日上线 Hugging Face,当前美国开源基准第一;白宫签发 AI 行政令要求前沿模型发布前 30 天自愿政府审测。

Agent 生态周报
2026/6/3 · 10:10
購読 1 件 · コンテンツ 3 件

リサーチノート

Build 2026 的第二天,微软把 Foundry Agent Service 从"好用的 demo 平台"推向了一个可以真实交付生产 Agent 的运营体系,并顺带发布了 Scout——第一个 Autopilot Agent 产品。同一天,Anthropic 向 SEC 递交了保密 S-1,年化营收 $47B 的数字比外界此前的估算还要高出一截。与此同时,NVIDIA Nemotron 3 Ultra 550B 定于明天上线 Hugging Face,提前泄出的基准成绩已经让美国开源模型阵营的其他玩家很难受。

Build 2026 Day 2:Foundry 搭好三层框架,Scout 成为第一个 Autopilot Agent

微软在 Day 2 把 Foundry Agent Service 的更新分成了 Build / Deploy / Operate 三层,主要逻辑是补上 Agent 走出笔记本电脑之后缺少的每一块。1
Build 层更新最多。Microsoft Agent Framework(MAF)v1.0 正式稳定,统一了 Semantic Kernel 的企业封装和 AutoGen 的多 Agent 编排——两者此前需要单独选择——现在 LangGraph、GitHub Copilot SDK 和 Claude Agent SDK 都可以直接接进来。Toolboxes in Foundry 进入公开预览,给 Agent 提供统一工具端点:MCP、OpenAPI、A2A 协议一个 URL 全部搞定,Auth 和 lifecycle 由平台托管,不再需要每个工具单独处理。记忆方面,新增「程序记忆」(Procedural Memory)——Agent 能记住「怎么做」而非只记住「说过什么」。官方 Tau-bench 测试数据显示,程序记忆带来的成功率绝对增益为 +7–14%,成本接近基线。
Deploy 层的核心是 Hosted Agents 即将 GA(30 天内),以及一个新的 Agent 分发路径:Autopilot Agents。这类 Agent 有独立 Entra 身份、邮箱地址和 Teams 出席状态,能主动发起会话、处理共享文件并跟进任务,和「Assistive Agent」(等待用户呼叫)、「Autonomous Agent」(按计划静默运行)构成三种部署模式。1
Microsoft Scout 是第一个落地的 Autopilot Agent。它由开源 OpenClaw 技术驱动,Work IQ 作为上下文引擎,可以在 Teams、Outlook、OneDrive 和 SharePoint 里执行多步骤工作流,并在本地设备上操作。Scout 的每一个操作都可追溯、可审计,管理员通过 Agent 365 统一配置策略。目前面向 Frontier 客户组开放早期访问,持有 GitHub Copilot 许可的用户可以下载体验。2
Operate 层是这次更新里技术密度最高的部分。Tracing & Evaluation 将在 6 月底 GA,基于统一的 OpenTelemetry 管道,每一次模型调用、工具执行和 Agent 跳转都打通成一条链路,评估结果直接反向关联到对应的生产 trace。更值得关注的是 Agent Optimizer:它消费生产 trace 和评估信号,自动生成 prompt、skill、工具描述等候选改进方案,排序后供工程师审核,支持差异对比、审计和一键回滚——把「Agent 失败→猜测修复→再测试」的循环替换成「观察→评估→优化→部署」的闭环。Agent Optimizer 目前处于私有预览,30 天后进入公开预览。3
此外,微软还宣布了 Project Solara——一个从芯片到云端的全栈 Agent 平台,面向多 Agent 开放世界设计,提供定制化硬件方案;Microsoft IQ 正式 GA,整合 Work IQ、Fabric IQ 和 Foundry IQ,在 GitHub Copilot、Foundry、Copilot Studio 之间统一企业上下文。Web IQ 作为实时外部接地 API,已经在 ChatGPT 和 Copilot 中运行,今日起向部分 Azure 客户开放有限访问。4
Microsoft Foundry Agent Factory 三层生产化体系(Build / Deploy / Operate)示意
Microsoft Foundry Agent Platform 三层架构示意 1
Hosted Agents 新增内置安全护栏: 托管代理现在原生集成 Azure Content Safety,用户输入在到达 Agent 代码前完成内容安全检测,Agent 输出在返回用户前同步过滤——这一点在语音 Agent 场景尤为重要,因为实时流式响应的传统后置过滤存在时序窗口。3
Hosted Agents Guardrails 配置界面,显示有害输入在到达 Agent 前被拦截
Foundry Hosted Agents 内置 Guardrails 配置示意,有害提示在输入阶段被拦截 3

コンテンツカードを読み込んでいます…

Anthropic 递交保密 S-1:年化 $47B,接近 $1 万亿估值

6 月 1 日,Anthropic 向 SEC 保密提交了 S-1 注册申请,进入 IPO 流程。5
几个关键数字:年化营收 $47B,潜在估值约 $1 万亿;3 月刚完成 $65B Series H 融资,估值 $965B。Fortune 援引分析师评价,认为这是「IPO 市场开闸的信号」。6
对 Agent 生态的判断意义:Anthropic Agent SDK 的独立计费(6 月 15 日生效)加上 IPO 路径明确,意味着 Claude 的定价逻辑将从「模型订阅」转向「可审计的 Agent 运行成本」。S-1 公开后,开发者成本结构将首次有了一份可以与投资者对账的参考坐标。

コンテンツカードを読み込んでいます…

NVIDIA Nemotron 3 Ultra 550B:明日上线,当前美国开源第一

NVIDIA Nemotron 3 Ultra 定于 6 月 4 日通过 Hugging Face 和 OpenRouter 上线。模型规格是 550B 总参数、55B 活跃参数的 MoE 架构(90% 稀疏度),在 Artificial Analysis Intelligence Index 上得分 48,领先 Google Gemma 4(39 分)和前代旗舰 Nemotron 3 Super(36 分)。7
推理速度同样是亮点:预发布端点上实测约 300 token/s,同规模的竞品开放模型约为 50–100 token/s。7
对选型判断的含义:550B MoE 架构意味着私有化部署需要大量 GPU 显存,但 OpenRouter 接入会让 API 调用成本相对可控。Nemotron 3 Ultra 的发布对编码 Agent 场景意义更直接——NVIDIA 与微软联合绑定了 OpenShell 安全运行时,硬件路线和云端路线开始合流。性能基准数据需要等 6 月 4 日上线后第三方独立验证才能形成更可靠的选型参考。

白宫行政令:前沿模型发布前 30 天自愿提交政府审测

6 月 2 日,白宫发布行政令《Promoting Advanced Artificial Intelligence Innovation and Security》,要求前沿 AI 模型开发商在发布前 30 天自愿将模型提交政府安全审测,覆盖部分关键基础设施运营商。8
「自愿」二字是政策的核心弹性点。NPR 报道显示,这标志着特朗普政府在 AI 安全态度上的实质性转向——此前的政策基调以放松监管为主。9 对 Agent 生态的直接影响目前有限,但如果「自愿」机制有效运转,下一步推动强制性审测的门槛会降低。

快看

  • GitHub Copilot Desktop App 进入预览,基于 git worktrees 实现并行 Agent 会话,每个 session 独立分支和上下文,支持暂停恢复,CPO Kyle Daigle 在 Latent.Space 播客中详述了 GitHub 的 Agent Era 规划。10
  • Foundry IQ GA:Web IQ(子模块)宣称回答质量、延迟、token 成本均优于同类接地方案,目前 ChatGPT 和 Copilot 都在使用,Azure 客户有限访问从今日开始。1
  • A2A 双向互通:Foundry 此前只支持「调用外部 Agent」,本次新增「暴露自身为 A2A 端点」,任何遵从 A2A 协议的 Agent 可以跨框架、跨云发现并调用。1

跨轮跟踪

事项状态下一个信号点
Nemotron 3 Ultra 550B明日(6/4)上线 Hugging Face / OpenRouter第三方独立基准测试
Foundry Hosted Agents GA30 天内正式 GA 公告
Agent Optimizer 公开预览30 天内上线公告,关注支持框架范围
Anthropic IPOS-1 已保密递交S-1 公开、路演时间表
Anthropic Agent SDK 计费6/15 生效首批账单数据(7 月底)
Claude Mythos三次泄露发布窗口或为 6-7 月
白宫 AI 行政令已签发主要 AI 厂商回应声明
GitHub Copilot token 计费影响6/1 生效7 月底结账数据

このコンテンツについて、さらに観点や背景を補足しましょう。

  • ログインするとコメントできます。