1. NVIDIA Cosmos 3 正式开源,首个物理 AI 全模态基础模型登场

Robotic arm in industrial setting

一句话: NVIDIA 于 GTC Taipei 发布 Cosmos 3,全球首个开源物理 AI 全模态模型,Nano(8B+8B)和 Super(32B+32B)两版已在 Hugging Face 同步开放。

物理 AI 时代的基础设施迎来里程碑。6 月 1 日,黄仁勋在 GTC Taipei 2026 暨 Computex 上发布 NVIDIA Cosmos 3,这是全球首个完全开源的物理 AI 全模态基础模型。Cosmos 3 基于创新的「混合专家 Transformer」架构,将视觉推理 Transformer 与专家生成 Transformer 配对,原生理解并生成文本、图像、视频、环境音和动作轨迹五种模态。发布当日,Nano 版(8B 推理器 + 8B 生成器)和 Super 版(32B + 32B)已同步上线 Hugging Face,完全开源免费可用。

对机器人和自动驾驶行业而言,Cosmos 3 的核心价值在于合成数据生成能力:以往需要耗费数月的真实场景数据采集和标注,在 Cosmos 3 的世界仿真引擎下有望压缩至数天。模型能够对物体交互、运动轨迹和时空关系进行物理准确的建模,再生成训练所需的视频和动作数据——这是此前任何开源模型都未能做到的。NVIDIA 同步宣布成立 Cosmos Coalition,汇聚 Agile Robots、Black Forest Labs、Runway 和 Skild AI 等顶级实验室,共同推进下一代开放世界模型的建设。

对开发者和研究者而言,Cosmos 3 的开源意味着零门槛进入物理 AI 领域。无论是高校机器人实验室、创业公司还是个人研究者,现在都可以直接下载模型权重,基于 Cosmos 3 训练具身智能策略或世界模型。NVIDIA 还预告了面向实时推理场景的 Cosmos 3 Edge 版本即将发布,将使模型能够直接部署在机器人终端上完成在线推理。从基础模型到边缘推理的完整开源链路一旦成型,物理 AI 的研发成本将大幅降低,加速具身智能从实验室走向产业落地。

> 来源: NVIDIA Newsroom · Hugging Face Blog · HPCwire AIwire

---

2. MiniMax M3 发布,MSA 架构 1M 上下文,SWE-Bench Pro 59% 超越 GPT-5.5

Developer working with code on multiple monitors

一句话: MiniMax M3 以自研 MSA 稀疏注意力架构实现 100 万 token 上下文,SWE-Bench Pro 得分 59%,超越 GPT-5.5 和 Gemini 3.1 Pro,是首个同时具备前沿编码、超长上下文和原生多模态能力的开源模型。

中国 AI 初创 MiniMax 在 6 月 1 日以一份亮眼的成绩单进入大模型竞争第一梯队。M3 搭载自研 MSA(MiniMax Sparse Attention)稀疏注意力架构,支持 100 万 token 原生上下文窗口,在 SWE-Bench Pro 软件工程评测上得分 59%,超越 GPT-5.5 和 Gemini 3.1 Pro,成为当前公开分数最高的开源模型。M3 同时原生支持图像、视频输入和桌面操作,API 自发布日起即可调用,模型权重计划在 10 天内开源。

MSA 架构是 M3 性能飞跃的核心。相比此前的稠密注意力设计,MSA 以更精细的方式对 Key-Value 块进行分区,并引入「KV outer gather Q」优化,在保持高有效上下文覆盖率的同时大幅降低计算开销。具体数字:与 MiniMax M2 相比,M3 在 100 万 token 场景下前填充速度提升 9 倍、解码速度提升 15 倍,而每 token 的计算量仅为上代的 1/20。这意味着开发者在使用超长上下文时无需为延迟和成本付出传统架构的巨额代价,真正将「百万上下文」变成日常可用的功能而非实验室参数。

MiniMax 将 M3 定位为「首个同时具备前沿编码、百万 token 上下文和原生多模态的开源模型」,这一组合在此前从未同时出现在一个开源模型中。对 IT 工程师和 AI 开发者的实际意义是:复杂的多文件代码库分析、超长文档摘要和多轮多模态 Agent 任务,现在有了一个不需要商业 API 密钥的强力选项。MiniMax API 今日可用,模型权重将在 10 天内开源;目前正在使用 GPT-5.5 或 Gemini 进行代码生成任务的团队,值得优先安排 M3 替换测评。

> 来源: MiniMax Blog · MarkTechPost · VentureBeat

---

3. Anthropic 签约 SpaceX Colossus 1,22 万 GPU,Claude Code 用量限制翻倍

Data center servers with blue lighting

一句话: Anthropic 宣布租用 SpaceX Colossus 1 数据中心全部产能——逾 300 兆瓦、22 万块 NVIDIA GPU,月内纳入运营,Claude Code 各计划五小时用量上限即刻翻倍,高峰限流取消。

就在秘密申请 IPO 后不到一周,Anthropic 再次以一笔巨型算力交易引发业界关注。公司宣布签约租用 SpaceX 旗下 Colossus 1 数据中心的全部产能:超过 300 兆瓦、逾 22 万块 NVIDIA GPU,预计在一个月内纳入 Anthropic 的运营体系。用户侧的最直接体现是:Claude Code 各计划(Pro、Max、Team 和按席位计费的 Enterprise)的五小时滚动用量上限全部翻倍,同时高峰时段的限流机制被彻底取消;Claude Opus 系列的 API 速率上限也获得「实质性提升」。

这笔 SpaceX 交易是 Anthropic 近期密集披露的算力版图中落地最快的一笔。此前已宣布的协议包括:与亚马逊签署的最高 5GW 协议(2026 年底前接近 1GW 新增容量)、与 Google 和博通签署的 5GW 协议(2027 年起陆续上线)、与微软和 NVIDIA 的战略合作(含 300 亿美元 Azure 容量),以及与 Fluidstack 合作的 500 亿美元美国 AI 基础设施投资。更值得关注的是,Anthropic 透露正在与 SpaceX 探索合作开发数 GW 规模的轨道级 AI 算力基础设施——这是首次有头部 AI 公司公开讨论太空算力的可能性。

对 Claude 用户而言,这次算力扩容的效果立竿见影:翻倍的速率上限意味着在相同时间窗口内可以处理更多并行 Agent 任务,而高峰限流的取消彻底消除了以往业务高峰期「被迫等待」的摩擦。对 AI 行业而言,Anthropic 这一轮算力版图的快速扩张恰好发生在 IPO 申请之后,市场解读是:公司在向机构投资者展示基础设施的可扩展性和增长置信度,为上市估值提供实物支撑。订阅 Claude Pro 及以上计划的开发者无需任何操作,新速率上限已自动生效。

> 来源: Anthropic · Engadget · MindStudio

---

4. Project Glasswing 扩至 150 组织 15 国,Mythos 已发现逾万零日漏洞

Cybersecurity digital lock concept

一句话: Anthropic 将 Project Glasswing 扩至约 150 个新组织、15 个以上国家,首次纳入电力、水务、医疗和通信行业,Claude Mythos 自 4 月以来累计发现逾 10000 个高危或严重零日漏洞。

Anthropic 于 6 月 2-3 日公布 Project Glasswing 的重大扩展。该计划旨在利用 Claude Mythos——Anthropic 迄今最强大的模型,同时也是一款为网络安全专门设计、具有特殊访问限制的版本——对全球关键软件基础设施进行主动漏洞扫描和修复。此次扩展新增约 150 个组织、覆盖 15 个以上国家,重点纳入电力、水务、医疗、通信和硬件行业,这些领域在今年 4 月的首批参与者中几乎没有代表。自 4 月上线以来,Mythos 已累计发现逾 10000 个高危或严重零日漏洞,涵盖所有主流操作系统和浏览器。

这一规模的漏洞发现速度是前所未有的。传统漏洞研究依赖人工安全研究员逐行审查代码,一个经验丰富的团队一年可能发现数十到数百个高危漏洞;而 Mythos 在数周内完成了覆盖主流 OS 和浏览器的系统性扫描,并发现过万漏洞。关键基础设施的网络安全风险一直是各国政府的重点关切——一次成功的电网攻击可影响数亿人口,而这些系统的软件更新周期往往以年计,历史遗留漏洞积累严重。Anthropic 通过 Glasswing 将 AI 的规模化能力引入这一领域,意味着防御方有机会在系统性层面追上攻击方。

Anthropic 计划在完成防止模型能力被滥用的安全机制后,公开发布 Mythos 的完整版本。公司预计这一进程将在 6-12 个月内完成,届时类 Mythos 级别的网络安全 AI 能力将向更广泛的安全社区开放。对网络安全从业者来说,这既是机遇也是挑战:机遇在于 AI 驱动的大规模漏洞扫描工具即将进入每个安全团队的工具箱;挑战在于攻击者同样可能将其用于进攻。Glasswing 目前仍处于邀请制,有意参与的基础设施运营商可通过 anthropic.com/glasswing 提交申请,或关注其合规工具生态的合作机会。

> 来源: Anthropic · TechCrunch · Cybersecurity Dive

---

5. xAI 暂停人工反馈招募,Grok Composer 2.5 上线,输入 token 价格降逾 100%

Abstract AI technology concept with neural network

一句话: 彭博社确认 xAI 已暂停会计师、科学家等专业领域 RLHF 训练师招募;同步上线的 Grok Composer 2.5 专为长时任务优化,输入定价 $0.50/M token,相比上版降幅超 100%。

六月初,xAI 在两条看似方向相反的新闻上同时成为行业焦点。彭博社 6 月 3 日报道,Elon Musk 旗下 xAI 已暂停针对会计师、金融专家、科学家乃至喜剧演员等专业领域人工反馈训练师的招募,而这批人才自年初起就是 xAI 全力争抢的对象,目的是教会 Grok 从报税到幽默感的一切能力。与此同时,xAI 上线了全新的 Grok Composer 2.5 模型,在 Grok Build 平台内提供,专为长时运行任务和复杂指令跟随场景优化,价格定为 $0.50/M 输入 token 和 $2.50/M 输出 token。

两件事放在一起解读,轮廓变得清晰:xAI 正在减少对人工反馈(RLHF)的依赖,转向更多合成数据或自动化训练管线。这一趋势在整个 AI 行业已初见苗头——Meta 和 Google 都在不同程度上探索以 AI 生成的对话和评分数据替代人工标注,以降低成本并加快迭代速度。xAI 的「停招」若是这一战略转型的公开信号,对整个 AI 训练行业的岗位结构将具有指标性意义。Grok Composer 2.5 相比 Grok Build 0.1 的输入 token 价格降幅超过 100%(实际价格不到原来一半),延续了近半年来大模型 API 价格快速下行的总体趋势。

对开发者的直接利好是 Grok Composer 2.5 的价格竞争力。在需要长时间运行的复杂 Agent 任务中,低输入成本的意义尤为关键——Agent 在多步推理中需要反复读取长上下文,输入 token 的消耗往往远大于输出,$0.50/M 输入的定价将 Composer 2.5 推入了目前性价比最高的一批编排用模型之列。对于仍在 RLHF 数据标注行业工作的从业者,xAI 的动作是一个需要认真对待的行业信号:大模型训练需求正在结构性转变,从人类反馈密集型向 AI 辅助训练迁移,专业标注岗位可能在未来两三年内面临系统性收缩。

> 来源: Bloomberg · Basenor · Engadget

JR Academy · Blog职业洞察

NVIDIA Cosmos 3 全开源 / MiniMax M3 超 GPT-5.5 / Anthropic SpaceX 22万GPU / Glasswing 万漏洞 / Grok换代停招

NVIDIA Cosmos 3 在 GTC Taipei 全面开源,首个物理 AI 全模态基础模型;MiniMax M3 以 MSA 架构和 59% SWE-Bench Pro 超越 GPT-5.5;Anthropic 签约 SpaceX Colossus 1 获 22 万 GPU 并双倍 Claude Code 速率;Project Glasswin...

发布日期
阅读时长2 分钟
作者

1. NVIDIA Cosmos 3 正式开源,首个物理 AI 全模态基础模型登场

Robotic arm in industrial setting

一句话: NVIDIA 于 GTC Taipei 发布 Cosmos 3,全球首个开源物理 AI 全模态模型,Nano(8B+8B)和 Super(32B+32B)两版已在 Hugging Face 同步开放。

物理 AI 时代的基础设施迎来里程碑。6 月 1 日,黄仁勋在 GTC Taipei 2026 暨 Computex 上发布 NVIDIA Cosmos 3,这是全球首个完全开源的物理 AI 全模态基础模型。Cosmos 3 基于创新的「混合专家 Transformer」架构,将视觉推理 Transformer 与专家生成 Transformer 配对,原生理解并生成文本、图像、视频、环境音和动作轨迹五种模态。发布当日,Nano 版(8B 推理器 + 8B 生成器)和 Super 版(32B + 32B)已同步上线 Hugging Face,完全开源免费可用。

对机器人和自动驾驶行业而言,Cosmos 3 的核心价值在于合成数据生成能力:以往需要耗费数月的真实场景数据采集和标注,在 Cosmos 3 的世界仿真引擎下有望压缩至数天。模型能够对物体交互、运动轨迹和时空关系进行物理准确的建模,再生成训练所需的视频和动作数据——这是此前任何开源模型都未能做到的。NVIDIA 同步宣布成立 Cosmos Coalition,汇聚 Agile Robots、Black Forest Labs、Runway 和 Skild AI 等顶级实验室,共同推进下一代开放世界模型的建设。

对开发者和研究者而言,Cosmos 3 的开源意味着零门槛进入物理 AI 领域。无论是高校机器人实验室、创业公司还是个人研究者,现在都可以直接下载模型权重,基于 Cosmos 3 训练具身智能策略或世界模型。NVIDIA 还预告了面向实时推理场景的 Cosmos 3 Edge 版本即将发布,将使模型能够直接部署在机器人终端上完成在线推理。从基础模型到边缘推理的完整开源链路一旦成型,物理 AI 的研发成本将大幅降低,加速具身智能从实验室走向产业落地。

> 来源: NVIDIA Newsroom · Hugging Face Blog · HPCwire AIwire

---

2. MiniMax M3 发布,MSA 架构 1M 上下文,SWE-Bench Pro 59% 超越 GPT-5.5

Developer working with code on multiple monitors

一句话: MiniMax M3 以自研 MSA 稀疏注意力架构实现 100 万 token 上下文,SWE-Bench Pro 得分 59%,超越 GPT-5.5 和 Gemini 3.1 Pro,是首个同时具备前沿编码、超长上下文和原生多模态能力的开源模型。

中国 AI 初创 MiniMax 在 6 月 1 日以一份亮眼的成绩单进入大模型竞争第一梯队。M3 搭载自研 MSA(MiniMax Sparse Attention)稀疏注意力架构,支持 100 万 token 原生上下文窗口,在 SWE-Bench Pro 软件工程评测上得分 59%,超越 GPT-5.5 和 Gemini 3.1 Pro,成为当前公开分数最高的开源模型。M3 同时原生支持图像、视频输入和桌面操作,API 自发布日起即可调用,模型权重计划在 10 天内开源。

MSA 架构是 M3 性能飞跃的核心。相比此前的稠密注意力设计,MSA 以更精细的方式对 Key-Value 块进行分区,并引入「KV outer gather Q」优化,在保持高有效上下文覆盖率的同时大幅降低计算开销。具体数字:与 MiniMax M2 相比,M3 在 100 万 token 场景下前填充速度提升 9 倍、解码速度提升 15 倍,而每 token 的计算量仅为上代的 1/20。这意味着开发者在使用超长上下文时无需为延迟和成本付出传统架构的巨额代价,真正将「百万上下文」变成日常可用的功能而非实验室参数。

MiniMax 将 M3 定位为「首个同时具备前沿编码、百万 token 上下文和原生多模态的开源模型」,这一组合在此前从未同时出现在一个开源模型中。对 IT 工程师和 AI 开发者的实际意义是:复杂的多文件代码库分析、超长文档摘要和多轮多模态 Agent 任务,现在有了一个不需要商业 API 密钥的强力选项。MiniMax API 今日可用,模型权重将在 10 天内开源;目前正在使用 GPT-5.5 或 Gemini 进行代码生成任务的团队,值得优先安排 M3 替换测评。

> 来源: MiniMax Blog · MarkTechPost · VentureBeat

---

3. Anthropic 签约 SpaceX Colossus 1,22 万 GPU,Claude Code 用量限制翻倍

Data center servers with blue lighting

一句话: Anthropic 宣布租用 SpaceX Colossus 1 数据中心全部产能——逾 300 兆瓦、22 万块 NVIDIA GPU,月内纳入运营,Claude Code 各计划五小时用量上限即刻翻倍,高峰限流取消。

就在秘密申请 IPO 后不到一周,Anthropic 再次以一笔巨型算力交易引发业界关注。公司宣布签约租用 SpaceX 旗下 Colossus 1 数据中心的全部产能:超过 300 兆瓦、逾 22 万块 NVIDIA GPU,预计在一个月内纳入 Anthropic 的运营体系。用户侧的最直接体现是:Claude Code 各计划(Pro、Max、Team 和按席位计费的 Enterprise)的五小时滚动用量上限全部翻倍,同时高峰时段的限流机制被彻底取消;Claude Opus 系列的 API 速率上限也获得「实质性提升」。

这笔 SpaceX 交易是 Anthropic 近期密集披露的算力版图中落地最快的一笔。此前已宣布的协议包括:与亚马逊签署的最高 5GW 协议(2026 年底前接近 1GW 新增容量)、与 Google 和博通签署的 5GW 协议(2027 年起陆续上线)、与微软和 NVIDIA 的战略合作(含 300 亿美元 Azure 容量),以及与 Fluidstack 合作的 500 亿美元美国 AI 基础设施投资。更值得关注的是,Anthropic 透露正在与 SpaceX 探索合作开发数 GW 规模的轨道级 AI 算力基础设施——这是首次有头部 AI 公司公开讨论太空算力的可能性。

对 Claude 用户而言,这次算力扩容的效果立竿见影:翻倍的速率上限意味着在相同时间窗口内可以处理更多并行 Agent 任务,而高峰限流的取消彻底消除了以往业务高峰期「被迫等待」的摩擦。对 AI 行业而言,Anthropic 这一轮算力版图的快速扩张恰好发生在 IPO 申请之后,市场解读是:公司在向机构投资者展示基础设施的可扩展性和增长置信度,为上市估值提供实物支撑。订阅 Claude Pro 及以上计划的开发者无需任何操作,新速率上限已自动生效。

> 来源: Anthropic · Engadget · MindStudio

---

4. Project Glasswing 扩至 150 组织 15 国,Mythos 已发现逾万零日漏洞

Cybersecurity digital lock concept

一句话: Anthropic 将 Project Glasswing 扩至约 150 个新组织、15 个以上国家,首次纳入电力、水务、医疗和通信行业,Claude Mythos 自 4 月以来累计发现逾 10000 个高危或严重零日漏洞。

Anthropic 于 6 月 2-3 日公布 Project Glasswing 的重大扩展。该计划旨在利用 Claude Mythos——Anthropic 迄今最强大的模型,同时也是一款为网络安全专门设计、具有特殊访问限制的版本——对全球关键软件基础设施进行主动漏洞扫描和修复。此次扩展新增约 150 个组织、覆盖 15 个以上国家,重点纳入电力、水务、医疗、通信和硬件行业,这些领域在今年 4 月的首批参与者中几乎没有代表。自 4 月上线以来,Mythos 已累计发现逾 10000 个高危或严重零日漏洞,涵盖所有主流操作系统和浏览器。

这一规模的漏洞发现速度是前所未有的。传统漏洞研究依赖人工安全研究员逐行审查代码,一个经验丰富的团队一年可能发现数十到数百个高危漏洞;而 Mythos 在数周内完成了覆盖主流 OS 和浏览器的系统性扫描,并发现过万漏洞。关键基础设施的网络安全风险一直是各国政府的重点关切——一次成功的电网攻击可影响数亿人口,而这些系统的软件更新周期往往以年计,历史遗留漏洞积累严重。Anthropic 通过 Glasswing 将 AI 的规模化能力引入这一领域,意味着防御方有机会在系统性层面追上攻击方。

Anthropic 计划在完成防止模型能力被滥用的安全机制后,公开发布 Mythos 的完整版本。公司预计这一进程将在 6-12 个月内完成,届时类 Mythos 级别的网络安全 AI 能力将向更广泛的安全社区开放。对网络安全从业者来说,这既是机遇也是挑战:机遇在于 AI 驱动的大规模漏洞扫描工具即将进入每个安全团队的工具箱;挑战在于攻击者同样可能将其用于进攻。Glasswing 目前仍处于邀请制,有意参与的基础设施运营商可通过 anthropic.com/glasswing 提交申请,或关注其合规工具生态的合作机会。

> 来源: Anthropic · TechCrunch · Cybersecurity Dive

---

5. xAI 暂停人工反馈招募,Grok Composer 2.5 上线,输入 token 价格降逾 100%

Abstract AI technology concept with neural network

一句话: 彭博社确认 xAI 已暂停会计师、科学家等专业领域 RLHF 训练师招募;同步上线的 Grok Composer 2.5 专为长时任务优化,输入定价 $0.50/M token,相比上版降幅超 100%。

六月初,xAI 在两条看似方向相反的新闻上同时成为行业焦点。彭博社 6 月 3 日报道,Elon Musk 旗下 xAI 已暂停针对会计师、金融专家、科学家乃至喜剧演员等专业领域人工反馈训练师的招募,而这批人才自年初起就是 xAI 全力争抢的对象,目的是教会 Grok 从报税到幽默感的一切能力。与此同时,xAI 上线了全新的 Grok Composer 2.5 模型,在 Grok Build 平台内提供,专为长时运行任务和复杂指令跟随场景优化,价格定为 $0.50/M 输入 token 和 $2.50/M 输出 token。

两件事放在一起解读,轮廓变得清晰:xAI 正在减少对人工反馈(RLHF)的依赖,转向更多合成数据或自动化训练管线。这一趋势在整个 AI 行业已初见苗头——Meta 和 Google 都在不同程度上探索以 AI 生成的对话和评分数据替代人工标注,以降低成本并加快迭代速度。xAI 的「停招」若是这一战略转型的公开信号,对整个 AI 训练行业的岗位结构将具有指标性意义。Grok Composer 2.5 相比 Grok Build 0.1 的输入 token 价格降幅超过 100%(实际价格不到原来一半),延续了近半年来大模型 API 价格快速下行的总体趋势。

对开发者的直接利好是 Grok Composer 2.5 的价格竞争力。在需要长时间运行的复杂 Agent 任务中,低输入成本的意义尤为关键——Agent 在多步推理中需要反复读取长上下文,输入 token 的消耗往往远大于输出,$0.50/M 输入的定价将 Composer 2.5 推入了目前性价比最高的一批编排用模型之列。对于仍在 RLHF 数据标注行业工作的从业者,xAI 的动作是一个需要认真对待的行业信号:大模型训练需求正在结构性转变,从人类反馈密集型向 AI 辅助训练迁移,专业标注岗位可能在未来两三年内面临系统性收缩。

> 来源: Bloomberg · Basenor · Engadget

作者
一键分享或复制链接

相关文章推荐

查看全部文章 →