1. Anthropic 秘密递交 S-1，估值 9650 亿美元 ARR 470 亿，冲刺万亿 IPO

Anthropic IPO S-1 Filing

一句话: Anthropic 6 月 1 日向 SEC 秘密递交 S-1，随附 65 亿美元 H 轮，估值 9650 亿美元，预计 10 月上市、破万亿可期。

Anthropic 在 2026 年 6 月 1 日悄然向美国证券交易委员会（SEC）递交了 S-1 招股说明书，选择「秘密申报」通道以争取在正式公开前与监管方充分沟通。此次申报随附公司最新一轮 65 亿美元 H 轮融资文件，投后估值约为 9650 亿美元——距万亿美元市值仅一步之遥。这是继 2025 年 F 轮后，Anthropic 不到 18 个月内完成的第二次规模融资，累计外部融资额突破 130 亿美元。在财务披露方面，Anthropic 透露截至 2026 年 5 月的年化收入（ARR）已达约 470 亿美元，2026 年 Q2 营收预计超过 109 亿美元，实现季度同比翻倍以上增长。主承销商目前尚未最终确定，但高盛、摩根士丹利等已进入候选名单，路演窗口预期锁定在 10 月份。

这次 IPO 引发市场广泛关注，原因不仅在于估值数字本身，更在于其背后的战略信号。Claude 商业化路径的快速成功证明了 Anthropic 「安全优先，商业第二」的定位并不妨碍其盈利能力；相反，在企业级市场（Claude for Enterprise、AWS 和 Google Cloud 的集成渠道）中，「安全 AI」的品牌溢价反而成了差异化卖点。Fortune 评论指出，若 Anthropic 成功以万亿估值上市，将「打开 AI 创业公司 IPO 市场的闸门」——届时 OpenAI、Mistral、Cohere 等公司都可能面临资本市场要求其给出上市时间表的压力。

对于 IT 从业者和开发者而言，Anthropic 上市后最直接的变化是：Claude API 的定价策略将受到华尔街盈利预期的约束，短期内大幅涨价的可能性下降；公司研报和财报将成为追踪 Claude 产品方向的公开信息渠道，模型路线图的透明度将显著提升。此外，上市公司地位也意味着 Anthropic 需要向投资者定期披露 AI 安全研究与商业产品之间的资源分配，或将影响 Claude 模型的迭代节奏与安全边界设定。

来源: Fortune - Anthropic IPO Filing · CNBC · CBS News

2. Google Gemini 3.5 Flash 正式 GA，2M Token 上下文主攻 Agent 与代码

Google Gemini 3.5 Flash GA

一句话: gemini-3.5-flash 本月正式进入通用可用阶段，支持 200 万 token 上下文，定位「持续前沿的 Agent 与代码智能」，旧版预览模型 6 月 25 日下线。

Google 在 2026 年 6 月的 Gemini API 更新中将 gemini-3.5-flash 标注为正式 GA（Generally Available），结束了此前数月的预览期。官方 changelog 将其定义为「我们在 Agent 和代码任务上最智能的持续前沿性能模型」，旗舰卖点是 200 万 token 的上下文窗口——约为目前大多数商用模型的 8-16 倍。同步发布的还有一则重要迁移通知：gemini-3.1-flash-image-preview 和 gemini-3-pro-image-preview 两款旧版预览模型将于 6 月 25 日正式停用，使用这两款模型的 API 调用届时将返回错误码。值得关注的是，Google I/O 2026 上发布的 Gemini 3.5 Pro（预告具备 Deep Think 推理模式和同级别的 2M token 上下文）尚未正式 GA，仍处于有限测试阶段，但 Flash 版本先行上线意味着 Pro 版发布窗口可能也在 6 月底前后。

200 万 token 上下文窗口进入正式商用阶段，其意义不可小觑。在 Agent 应用中，极长上下文意味着 Agent 可以在一次调用中持有完整的工具调用历史、长期规划记录和当前环境状态，大幅降低了多轮对话中的「遗忘」风险。在代码场景中，整个中型代码库（约 50 万行 Python）可以一次性注入，使代码审查、重构建议和跨文件依赖分析变得更加可靠。对比 Anthropic Claude Opus 4.8 的 200K token 和 OpenAI GPT-5.5 的 128K token，Gemini 3.5 Flash 的上下文容量达到前者的 10 倍，为特定场景提供了显著优势。

开发者接入路径：gemini-3.5-flash 可通过 Google AI Studio（免费测试）和 Vertex AI（生产调用，需 Google Cloud 账号）直接访问。对于仍在使用 gemini-3.1-flash-image-preview 或 gemini-3-pro-image-preview 的项目，迁移窗口仅剩约两周，建议优先完成模型名称替换和功能验证，避免 6 月 25 日后的服务中断。Vertex AI 上可通过模型参数对比新旧版本的响应差异，建议在生产迁移前跑完关键用例的回归测试。

来源: Google AI Developers Changelog · TechTimes

3. xAI Grok V9 在 1.5T 参数量训练中，同步发布 Grok Voice 与编程模型 Grok Build

xAI Grok V9 Training

一句话: Grok V9-Medium 以 1.5 万亿参数完成预训练，是现行 V8-Small 的 3 倍，SFT 与强化学习进行中，预计 6 月中旬发布；同期上线 Grok Voice 与 $1/$2 定价的编程模型 Grok Build 0.1。

xAI 最新动态显示，Grok V9-Medium 已在 Colossus 2 超算集群上完成 1.5 万亿（1.5T）参数的预训练阶段，目前进入监督式微调（SFT）和强化学习（RL）阶段，Elon Musk 在 X 平台确认预计 6 月中旬向用户公开发布。作为对比，当前生产环境中运行的 Grok V8-Small 参数量约为 500B（5000 亿），V9-Medium 的规模是其 3 倍。同步在 6 月 4 日发布的还有两款新产品：Grok Voice（支持 xAI API 的口语交互接口，已与 Vapi 合作服务 250 万语音 Agent）和 Grok Build 0.1（专为代码场景优化的编程模型，256K token 上下文，内置持续推理，定价 $1 per 1M input tokens / $2 per 1M output tokens，目前 API 公测）。

Grok V9 的参数规模引发了业界对其性能上限的广泛猜测。xAI 方面透露，Grok 4.4（1T 参数）和 Grok 4.5（1.5T 参数）将在数周内相继发布，而 Grok 5 正在训练中，部分变体参数量将达到 10T（10 万亿）级别——如果属实，这将是目前公开披露的最大规模 AI 模型。值得关注的是，xAI 同期宣布暂停部分专项训练师岗位的招募，Bloomberg 报道指出这可能意味着 xAI 正在转向更多依赖合成数据和自动化评估流程，减少人工标注环节的比重。Grok Build 0.1 的低定价（约为 Claude Opus 4.8 的 1/15）也将进一步压缩代码助手市场的价格上限。

对开发者而言，Grok Build 0.1 目前是 xAI API 中最具性价比的选项，适合需要持续推理的代码生成、调试和代码审查任务。申请公测资格可通过 docs.x.ai 提交；Grok Voice 接口已对外开放，基于 Vapi 构建的语音 Agent 开发者可直接接入 xAI 语音引擎（12 种核心声音）。Grok V9 正式发布后，建议在 SWE-Bench、HumanEval 等代码基准上与 GPT-5.5 和 Claude Opus 4.8 做横向对比，再决定是否迁移核心工作流。

来源: xAI News · Bloomberg · SwipeInsight

4. ChatGPT 记忆系统全面升级，「做梦」机制自动修正过期记忆

ChatGPT Memory Dreaming Feature

一句话: ChatGPT 新记忆系统引入「做梦（Dreaming）」功能，AI 可在对话间隔自动修订时态过期的记忆，Plus/Pro 用户容量翻倍，迈向时态感知的长期个性化助手。

OpenAI 在 2026 年 6 月推出了 ChatGPT 记忆系统的重大升级版本，包含三项核心改进。第一是容量翻倍：ChatGPT Plus 和 Pro 用户的记忆存储容量扩大为原来的两倍，可以保存更多关于用户偏好、习惯和长期目标的信息。第二是「做梦（Dreaming）」机制：ChatGPT 现在可以在两次对话之间主动修订记忆中过期的事件状态——例如，当初记录为「你将于 7 月前往新加坡」的记忆，在 7 月后会被系统自动更新为「你于 7 月去了新加坡」，保持记忆的时效性和准确性。第三是增强的个性化推断能力：系统可从用户的对话行为模式中自动提炼出未明说的偏好（如常用语言、回复风格、关注话题），无需用户手动告知。

「做梦」功能的引入标志着 AI 助手在记忆管理上的范式升级。此前，所有 AI 个人助手面临的共同缺陷是「记忆不会过时」——用户告知过的事件或计划，即使已经发生或取消，依然会被系统当作未来事实处理，造成上下文混乱。「做梦」机制通过后台异步推理修正这一问题，使 ChatGPT 的长期对话一致性大幅提升。这对于将 ChatGPT 用作私人日程助手、职业规划工具或学习伙伴的用户而言价值尤其明显。OpenAI 发布后，业界已有声音指出 Anthropic 的 Claude 和 Google 的 Gemini 都没有类似的时态感知记忆机制，预期将在未来几个月推出对应功能。

使用建议：Plus/Pro 用户升级后无需任何额外操作，新版记忆系统将自动生效。建议用户通过「设置→个性化→记忆」查看当前存储的记忆内容，确认是否有需要删除的过时信息。对于担心隐私的用户，可以随时关闭记忆功能或手动删除特定条目；「做梦」功能的修订过程也会在记忆列表中留下变更记录，方便追溯。免费版用户暂未获得容量翻倍，但「做梦」机制对所有有记忆功能的账户均适用。

来源: OpenAI Release Notes · Releasebot ChatGPT Updates

5. DeepSeek 7 月 24 日废弃旧 API 名，deepseek-chat / deepseek-reasoner 统一迁至 V4-Flash

DeepSeek API Migration

一句话: DeepSeek 官方宣布 2026 年 7 月 24 日 UTC 停用历史模型名 deepseek-chat 和 deepseek-reasoner，分别对应 deepseek-v4-flash 的非思考与思考模式，100 万 token 上下文窗口全面开放。

DeepSeek 官方 API 文档在近期更新中正式宣布：自 2026 年 7 月 24 日 15:59 UTC 起，历史遗留的两个模型标识符 deepseek-chat 和 deepseek-reasoner 将被永久停用。官方说明澄清，这两个名称实际上是对同一底层模型架构（deepseek-v4-flash）两种推理模式的别名——deepseek-chat 对应「非思考模式（non-thinking mode）」，deepseek-reasoner 对应「思考模式（thinking mode）」。迁移后，开发者需直接使用 deepseek-v4-flash 作为模型名，并通过 thinking_mode 参数（true/false）显式控制推理模式。DeepSeek 目前的 API 产品线涵盖两款核心模型：deepseek-v4-flash（284B 总参数，13B 激活，100 万 token 上下文）和 deepseek-v4-pro（1.6 万亿总参数，49B 激活，100 万 token 上下文），两款均在知识处理和 Agent 任务基准上取得强势表现。

此次 API 迁移背后是 DeepSeek 产品线的整体架构重构。DeepSeek 在今年 4 月底发布 V4 系列（V4-Pro 和 V4-Flash）后，持续通过 API changelog 推动用户升级，此次废弃旧别名是清理遗留混淆的最后一步。从技术层面来看，V4-Flash 在单 token 推理 FLOPs 上比 V3.2 降低了 73%（仅需 27% 的计算量），KV cache 也只有 V3.2 的 10%，使得 100 万 token 超长文档处理的成本和延迟均大幅下降。V4-Pro 则面向对精度要求更高的 Agent 工作流和知识密集型任务。两款模型均已通过 DeepSeek API（api.deepseek.com）开放商用调用，定价相比 Anthropic 和 OpenAI 旗舰模型仍有明显优势。

开发者行动清单：首先检查所有生产代码中是否存在 model: "deepseek-chat" 或 model: "deepseek-reasoner" 的字符串，将其替换为 model: "deepseek-v4-flash"，并按需添加 thinking_mode 参数；其次在 staging 环境验证迁移后的响应格式和性能是否符合预期（V4-Flash 与旧版 V3 系列存在响应结构差异）；最后设置 7 月 24 日前的迁移 deadline 提醒，避免 API 调用在当天突然返回 InvalidModel 错误导致服务中断。如需升级至更高性能的 V4-Pro，可通过 model: "deepseek-v4-pro" 直接切换，定价差异可在 DeepSeek API 定价页面确认。

来源: DeepSeek API Docs · CNBC · SitePoint DeepSeek V4

JR Academy · Blog职业洞察

Anthropic 冲刺 IPO / Gemini 3.5 Flash 上线 / Grok V9 炼到 1.5T / ChatGPT 记忆进化 / DeepSeek API 迁移

Anthropic 以 9650 亿美元估值秘密递交 S-1；Google Gemini 3.5 Flash 正式 GA 支持 2M Token；xAI Grok V9 以 1.5 万亿参数量训练中，同步发布 Grok Voice 与编程模型；ChatGPT 记忆系统引入「做梦」自动刷新机制；DeepSeek 宣布 7 月 24 日废弃旧版 API 名。

发布日期2026-06-08

阅读时长3 分钟

作者

快速导航

1. Anthropic 秘密递交 S-1，估值 9650 亿美元 ARR 470 亿，冲刺万亿 IPO
2. Google Gemini 3.5 Flash 正式 GA，2M Token 上下文主攻 Agent 与代码
3. xAI Grok V9 在 1.5T 参数量训练中，同步发布 Grok Voice 与编程模型 Grok Build
4. ChatGPT 记忆系统全面升级，「做梦」机制自动修正过期记忆
5. DeepSeek 7 月 24 日废弃旧 API 名，deepseek-chat / deepseek-reasoner 统一迁至 V4-Flash

1. Anthropic 秘密递交 S-1，估值 9650 亿美元 ARR 470 亿，冲刺万亿 IPO

Anthropic IPO S-1 Filing

一句话: Anthropic 6 月 1 日向 SEC 秘密递交 S-1，随附 65 亿美元 H 轮，估值 9650 亿美元，预计 10 月上市、破万亿可期。

来源: Fortune - Anthropic IPO Filing · CNBC · CBS News

2. Google Gemini 3.5 Flash 正式 GA，2M Token 上下文主攻 Agent 与代码

Google Gemini 3.5 Flash GA

一句话: gemini-3.5-flash 本月正式进入通用可用阶段，支持 200 万 token 上下文，定位「持续前沿的 Agent 与代码智能」，旧版预览模型 6 月 25 日下线。

来源: Google AI Developers Changelog · TechTimes

3. xAI Grok V9 在 1.5T 参数量训练中，同步发布 Grok Voice 与编程模型 Grok Build

xAI Grok V9 Training

来源: xAI News · Bloomberg · SwipeInsight

4. ChatGPT 记忆系统全面升级，「做梦」机制自动修正过期记忆

ChatGPT Memory Dreaming Feature

来源: OpenAI Release Notes · Releasebot ChatGPT Updates

5. DeepSeek 7 月 24 日废弃旧 API 名，deepseek-chat / deepseek-reasoner 统一迁至 V4-Flash

DeepSeek API Migration

来源: DeepSeek API Docs · CNBC · SitePoint DeepSeek V4

作者

一键分享或复制链接

1. Anthropic 秘密递交 S-1，估值 9650 亿美元 ARR 470 亿，冲刺万亿 IPO

2. Google Gemini 3.5 Flash 正式 GA，2M Token 上下文主攻 Agent 与代码

3. xAI Grok V9 在 1.5T 参数量训练中，同步发布 Grok Voice 与编程模型 Grok Build

4. ChatGPT 记忆系统全面升级，「做梦」机制自动修正过期记忆

5. DeepSeek 7 月 24 日废弃旧 API 名，deepseek-chat / deepseek-reasoner 统一迁至 V4-Flash

Anthropic 冲刺 IPO / Gemini 3.5 Flash 上线 / Grok V9 炼到 1.5T / ChatGPT 记忆进化 / DeepSeek API 迁移

1. Anthropic 秘密递交 S-1，估值 9650 亿美元 ARR 470 亿，冲刺万亿 IPO

2. Google Gemini 3.5 Flash 正式 GA，2M Token 上下文主攻 Agent 与代码

3. xAI Grok V9 在 1.5T 参数量训练中，同步发布 Grok Voice 与编程模型 Grok Build

4. ChatGPT 记忆系统全面升级，「做梦」机制自动修正过期记忆

5. DeepSeek 7 月 24 日废弃旧 API 名，deepseek-chat / deepseek-reasoner 统一迁至 V4-Flash

相关文章推荐

GitHub Copilot 实战指南 — 常见问题、定价与选型建议

GitHub Copilot 实战指南 — 进阶玩法：Coding Agent、自定义指令与 MCP

GitHub Copilot 实战指南 — 核心功能深度解析：补全、Chat 与 Agent Mode

GitHub Copilot 实战指南 — 快速上手：注册免费版 + 第一次 AI 编程

GitHub Copilot 实战指南 — GitHub Copilot 是什么：全球最大的 AI 编程助手

Continue 实战手册：开源 AI 编程助手完全指南 — Continue 常见问题 FAQ：避坑指南与选型建议