1. Anthropic 秘密递交 S-1,估值 9650 亿美元 ARR 470 亿,冲刺万亿 IPO
一句话: Anthropic 6 月 1 日向 SEC 秘密递交 S-1,随附 65 亿美元 H 轮,估值 9650 亿美元,预计 10 月上市、破万亿可期。
Anthropic 在 2026 年 6 月 1 日悄然向美国证券交易委员会(SEC)递交了 S-1 招股说明书,选择「秘密申报」通道以争取在正式公开前与监管方充分沟通。此次申报随附公司最新一轮 65 亿美元 H 轮融资文件,投后估值约为 9650 亿美元——距万亿美元市值仅一步之遥。这是继 2025 年 F 轮后,Anthropic 不到 18 个月内完成的第二次规模融资,累计外部融资额突破 130 亿美元。在财务披露方面,Anthropic 透露截至 2026 年 5 月的年化收入(ARR)已达约 470 亿美元,2026 年 Q2 营收预计超过 109 亿美元,实现季度同比翻倍以上增长。主承销商目前尚未最终确定,但高盛、摩根士丹利等已进入候选名单,路演窗口预期锁定在 10 月份。
这次 IPO 引发市场广泛关注,原因不仅在于估值数字本身,更在于其背后的战略信号。Claude 商业化路径的快速成功证明了 Anthropic 「安全优先,商业第二」的定位并不妨碍其盈利能力;相反,在企业级市场(Claude for Enterprise、AWS 和 Google Cloud 的集成渠道)中,「安全 AI」的品牌溢价反而成了差异化卖点。Fortune 评论指出,若 Anthropic 成功以万亿估值上市,将「打开 AI 创业公司 IPO 市场的闸门」——届时 OpenAI、Mistral、Cohere 等公司都可能面临资本市场要求其给出上市时间表的压力。
对于 IT 从业者和开发者而言,Anthropic 上市后最直接的变化是:Claude API 的定价策略将受到华尔街盈利预期的约束,短期内大幅涨价的可能性下降;公司研报和财报将成为追踪 Claude 产品方向的公开信息渠道,模型路线图的透明度将显著提升。此外,上市公司地位也意味着 Anthropic 需要向投资者定期披露 AI 安全研究与商业产品之间的资源分配,或将影响 Claude 模型的迭代节奏与安全边界设定。
> 来源: Fortune - Anthropic IPO Filing · CNBC · CBS News
---
2. Google Gemini 3.5 Flash 正式 GA,2M Token 上下文主攻 Agent 与代码
一句话: gemini-3.5-flash 本月正式进入通用可用阶段,支持 200 万 token 上下文,定位「持续前沿的 Agent 与代码智能」,旧版预览模型 6 月 25 日下线。
Google 在 2026 年 6 月的 Gemini API 更新中将 gemini-3.5-flash 标注为正式 GA(Generally Available),结束了此前数月的预览期。官方 changelog 将其定义为「我们在 Agent 和代码任务上最智能的持续前沿性能模型」,旗舰卖点是 200 万 token 的上下文窗口——约为目前大多数商用模型的 8-16 倍。同步发布的还有一则重要迁移通知:gemini-3.1-flash-image-preview 和 gemini-3-pro-image-preview 两款旧版预览模型将于 6 月 25 日正式停用,使用这两款模型的 API 调用届时将返回错误码。值得关注的是,Google I/O 2026 上发布的 Gemini 3.5 Pro(预告具备 Deep Think 推理模式和同级别的 2M token 上下文)尚未正式 GA,仍处于有限测试阶段,但 Flash 版本先行上线意味着 Pro 版发布窗口可能也在 6 月底前后。
200 万 token 上下文窗口进入正式商用阶段,其意义不可小觑。在 Agent 应用中,极长上下文意味着 Agent 可以在一次调用中持有完整的工具调用历史、长期规划记录和当前环境状态,大幅降低了多轮对话中的「遗忘」风险。在代码场景中,整个中型代码库(约 50 万行 Python)可以一次性注入,使代码审查、重构建议和跨文件依赖分析变得更加可靠。对比 Anthropic Claude Opus 4.8 的 200K token 和 OpenAI GPT-5.5 的 128K token,Gemini 3.5 Flash 的上下文容量达到前者的 10 倍,为特定场景提供了显著优势。
开发者接入路径:gemini-3.5-flash 可通过 Google AI Studio(免费测试)和 Vertex AI(生产调用,需 Google Cloud 账号)直接访问。对于仍在使用 gemini-3.1-flash-image-preview 或 gemini-3-pro-image-preview 的项目,迁移窗口仅剩约两周,建议优先完成模型名称替换和功能验证,避免 6 月 25 日后的服务中断。Vertex AI 上可通过模型参数对比新旧版本的响应差异,建议在生产迁移前跑完关键用例的回归测试。
> 来源: Google AI Developers Changelog · TechTimes
---
3. xAI Grok V9 在 1.5T 参数量训练中,同步发布 Grok Voice 与编程模型 Grok Build
一句话: Grok V9-Medium 以 1.5 万亿参数完成预训练,是现行 V8-Small 的 3 倍,SFT 与强化学习进行中,预计 6 月中旬发布;同期上线 Grok Voice 与 $1/$2 定价的编程模型 Grok Build 0.1。
xAI 最新动态显示,Grok V9-Medium 已在 Colossus 2 超算集群上完成 1.5 万亿(1.5T)参数的预训练阶段,目前进入监督式微调(SFT)和强化学习(RL)阶段,Elon Musk 在 X 平台确认预计 6 月中旬向用户公开发布。作为对比,当前生产环境中运行的 Grok V8-Small 参数量约为 500B(5000 亿),V9-Medium 的规模是其 3 倍。同步在 6 月 4 日发布的还有两款新产品:Grok Voice(支持 xAI API 的口语交互接口,已与 Vapi 合作服务 250 万语音 Agent)和 Grok Build 0.1(专为代码场景优化的编程模型,256K token 上下文,内置持续推理,定价 $1 per 1M input tokens / $2 per 1M output tokens,目前 API 公测)。
Grok V9 的参数规模引发了业界对其性能上限的广泛猜测。xAI 方面透露,Grok 4.4(1T 参数)和 Grok 4.5(1.5T 参数)将在数周内相继发布,而 Grok 5 正在训练中,部分变体参数量将达到 10T(10 万亿)级别——如果属实,这将是目前公开披露的最大规模 AI 模型。值得关注的是,xAI 同期宣布暂停部分专项训练师岗位的招募,Bloomberg 报道指出这可能意味着 xAI 正在转向更多依赖合成数据和自动化评估流程,减少人工标注环节的比重。Grok Build 0.1 的低定价(约为 Claude Opus 4.8 的 1/15)也将进一步压缩代码助手市场的价格上限。
对开发者而言,Grok Build 0.1 目前是 xAI API 中最具性价比的选项,适合需要持续推理的代码生成、调试和代码审查任务。申请公测资格可通过 docs.x.ai 提交;Grok Voice 接口已对外开放,基于 Vapi 构建的语音 Agent 开发者可直接接入 xAI 语音引擎(12 种核心声音)。Grok V9 正式发布后,建议在 SWE-Bench、HumanEval 等代码基准上与 GPT-5.5 和 Claude Opus 4.8 做横向对比,再决定是否迁移核心工作流。
> 来源: xAI News · Bloomberg · SwipeInsight
---
4. ChatGPT 记忆系统全面升级,「做梦」机制自动修正过期记忆
一句话: ChatGPT 新记忆系统引入「做梦(Dreaming)」功能,AI 可在对话间隔自动修订时态过期的记忆,Plus/Pro 用户容量翻倍,迈向时态感知的长期个性化助手。
OpenAI 在 2026 年 6 月推出了 ChatGPT 记忆系统的重大升级版本,包含三项核心改进。第一是容量翻倍:ChatGPT Plus 和 Pro 用户的记忆存储容量扩大为原来的两倍,可以保存更多关于用户偏好、习惯和长期目标的信息。第二是「做梦(Dreaming)」机制:ChatGPT 现在可以在两次对话之间主动修订记忆中过期的事件状态——例如,当初记录为「你将于 7 月前往新加坡」的记忆,在 7 月后会被系统自动更新为「你于 7 月去了新加坡」,保持记忆的时效性和准确性。第三是增强的个性化推断能力:系统可从用户的对话行为模式中自动提炼出未明说的偏好(如常用语言、回复风格、关注话题),无需用户手动告知。
「做梦」功能的引入标志着 AI 助手在记忆管理上的范式升级。此前,所有 AI 个人助手面临的共同缺陷是「记忆不会过时」——用户告知过的事件或计划,即使已经发生或取消,依然会被系统当作未来事实处理,造成上下文混乱。「做梦」机制通过后台异步推理修正这一问题,使 ChatGPT 的长期对话一致性大幅提升。这对于将 ChatGPT 用作私人日程助手、职业规划工具或学习伙伴的用户而言价值尤其明显。OpenAI 发布后,业界已有声音指出 Anthropic 的 Claude 和 Google 的 Gemini 都没有类似的时态感知记忆机制,预期将在未来几个月推出对应功能。
使用建议:Plus/Pro 用户升级后无需任何额外操作,新版记忆系统将自动生效。建议用户通过「设置→个性化→记忆」查看当前存储的记忆内容,确认是否有需要删除的过时信息。对于担心隐私的用户,可以随时关闭记忆功能或手动删除特定条目;「做梦」功能的修订过程也会在记忆列表中留下变更记录,方便追溯。免费版用户暂未获得容量翻倍,但「做梦」机制对所有有记忆功能的账户均适用。
> 来源: OpenAI Release Notes · Releasebot ChatGPT Updates
---
5. DeepSeek 7 月 24 日废弃旧 API 名,deepseek-chat / deepseek-reasoner 统一迁至 V4-Flash
一句话: DeepSeek 官方宣布 2026 年 7 月 24 日 UTC 停用历史模型名 deepseek-chat 和 deepseek-reasoner,分别对应 deepseek-v4-flash 的非思考与思考模式,100 万 token 上下文窗口全面开放。
DeepSeek 官方 API 文档在近期更新中正式宣布:自 2026 年 7 月 24 日 15:59 UTC 起,历史遗留的两个模型标识符 deepseek-chat 和 deepseek-reasoner 将被永久停用。官方说明澄清,这两个名称实际上是对同一底层模型架构(deepseek-v4-flash)两种推理模式的别名——deepseek-chat 对应「非思考模式(non-thinking mode)」,deepseek-reasoner 对应「思考模式(thinking mode)」。迁移后,开发者需直接使用 deepseek-v4-flash 作为模型名,并通过 thinking_mode 参数(true/false)显式控制推理模式。DeepSeek 目前的 API 产品线涵盖两款核心模型:deepseek-v4-flash(284B 总参数,13B 激活,100 万 token 上下文)和 deepseek-v4-pro(1.6 万亿总参数,49B 激活,100 万 token 上下文),两款均在知识处理和 Agent 任务基准上取得强势表现。
此次 API 迁移背后是 DeepSeek 产品线的整体架构重构。DeepSeek 在今年 4 月底发布 V4 系列(V4-Pro 和 V4-Flash)后,持续通过 API changelog 推动用户升级,此次废弃旧别名是清理遗留混淆的最后一步。从技术层面来看,V4-Flash 在单 token 推理 FLOPs 上比 V3.2 降低了 73%(仅需 27% 的计算量),KV cache 也只有 V3.2 的 10%,使得 100 万 token 超长文档处理的成本和延迟均大幅下降。V4-Pro 则面向对精度要求更高的 Agent 工作流和知识密集型任务。两款模型均已通过 DeepSeek API(api.deepseek.com)开放商用调用,定价相比 Anthropic 和 OpenAI 旗舰模型仍有明显优势。
开发者行动清单:首先检查所有生产代码中是否存在 model: "deepseek-chat" 或 model: "deepseek-reasoner" 的字符串,将其替换为 model: "deepseek-v4-flash",并按需添加 thinking_mode 参数;其次在 staging 环境验证迁移后的响应格式和性能是否符合预期(V4-Flash 与旧版 V3 系列存在响应结构差异);最后设置 7 月 24 日前的迁移 deadline 提醒,避免 API 调用在当天突然返回 InvalidModel 错误导致服务中断。如需升级至更高性能的 V4-Pro,可通过 model: "deepseek-v4-pro" 直接切换,定价差异可在 DeepSeek API 定价页面确认。
> 来源: DeepSeek API Docs · CNBC · SitePoint DeepSeek V4