1. Claude Fable 5 带新护栏重新向全球开放
一句话: Anthropic 与美国政府协商后解除出口限制,Claude Fable 5 携专项网络安全拦截分类器重新向全球用户开放。
Claude Fable 5 自今年初因美国出口管制政策而受限以来,一直是 Anthropic 产品线中"缺席"的旗舰。7 月 1 日,Anthropic 官方宣布,在与美国政府进行深入沟通并就风险缓解达成共识后,出口管制已正式解除。Fable 5 与 Mythos 5 同步重新上线,全球用户可直接在 Claude.ai 和 API 中访问。
此次重新部署并非简单回滚。Anthropic 同步发布了专项网络安全任务拦截分类器,能够识别并屏蔽高风险的漏洞利用辅助、攻击脚本生成等请求。这一举措体现了 Anthropic 在"能力开放"与"风险管控"之间寻找新平衡的思路——通过技术护栏而非粗粒度地区封锁来应对安全顾虑。从治理视角看,这也是 AI 公司与政府监管机构协同制定"能力开放路径"的一次重要先例。
对于开发者而言,Fable 5 的回归意味着可以重新调用其在复杂推理、多步骤 Agent 任务和长文档处理上的顶级能力。但需要注意的是,新增的网络安全分类器会对相关领域的 prompt 产生拦截,安全研究人员和渗透测试工具开发者需要重新评估工作流,必要时与 Anthropic 申请专项白名单。整体来看,这是 Anthropic 在保持开放竞争力的同时,向监管机构展示负责任 AI 部署能力的一次战略布局。
来源: Anthropic 官方公告 · 9to5Google 报道
2. Claude Sonnet 5 全量上线,1M Token 上下文成为所有用户的新默认
一句话: Claude Sonnet 5 成为 Anthropic 史上最强 Sonnet,1M 上下文+大幅提升的 Agent 能力,7 月 1 日起对所有 Free 和 Pro 用户默认开放。
Claude Sonnet 5 的发布被 Anthropic 内部定位为"年度最重要的大众模型升级"。相比 Sonnet 4.6,新版在编码、推理、工具使用和多步骤 Agent 任务上均有显著提升,且首次支持原生 100 万 Token 的上下文窗口。这意味着用户可以将一整个代码库、一份长篇研究报告或数百页合同文件直接塞入单次对话,而无需手动分块处理。
在定价策略上,Anthropic 采用了积极的市场扩张打法:促销价 $2 输入 / $10 输出(每百万 Token),有效期至 8 月 31 日。这一价格将 Sonnet 5 的调用成本降至 Sonnet 4.6 时代的相近水平,同时大幅提升了交付质量。对于正在评估 LLM 供应商的企业用户,当前窗口期是锁定成本基准的绝佳时机。值得关注的是,Anthropic 同期还为企业版用户推出了更丰富的 Admin Analytics 和模型级权限控制,进一步强化了平台粘性。
从竞争格局看,Sonnet 5 的全量上线与 OpenAI GPT-5.6 系列几乎同期发生,两家头部 AI 公司在 7 月的密集发布节奏清晰展示了模型更新周期的加速趋势。对于 IT 从业者和 AI 应用开发者,这也意味着"性能基线"在持续快速上移——今天的旗舰级能力,可能在半年内成为中档模型的标配。建议团队尽快评估 Sonnet 5 在实际工作流中的表现,提前规划迁移路径。
3. OpenAI GPT-5.6 三档模型家族:Sol / Terra / Luna 分层定价,旗舰冲速度极限
一句话: OpenAI 发布旗舰 Sol、性价比 Terra、极速 Luna 三档模型,Sol 在 Cerebras 上实现 750 tokens/s 的推理速率,当前约 20 家机构获政府审批预览资格。
GPT-5.6 系列代表了 OpenAI 在商业化策略上的重要转型——从单一旗舰模型转向多档位产品线,以满足不同客户群体对能力、成本和速度的差异化需求。Sol 定位顶级推理旗舰,定价 $5 输入 / $30 输出;Terra 主打能力与成本平衡,定价 $2.50/$15;Luna 则以极致速度和低成本见长,定价仅 $1/$6。三档策略使 OpenAI 可以同时覆盖科研机构的高精度需求和实时应用的高吞吐场景。
Sol 在 Cerebras 硬件上的部署是本次发布的技术亮点。750 tokens/s 的推理速率是传统 GPU 集群难以实现的速度量级,对于实时语音交互、在线客服、高频 Agent 场景具有明显优势。这也标志着 OpenAI 在推理基础设施上开始与非英伟达路线的硬件厂商进行更深层次的合作——这一趋势在算力竞争加剧的背景下值得持续关注。
目前 GPT-5.6 仍处于政府审批机构的限量预览阶段,约 20 家组织获得访问资格,公测时间线尚未公布。对于大多数开发者和企业用户,短期内仍需继续使用 GPT-4o 或等待官方开放通知。不过,定价体系的提前公布为预算规划提供了参考依据。建议团队现在开始评估各档位模型与自身场景的匹配度,以便公测开放时能快速决策迁移。
4. Gemini Spark 登陆 Mac,跨 App 真实世界操控能力来了
一句话: Google Gemini Spark AI 代理扩展至 Mac,可直接操控 Canva、Instacart、OpenTable 等第三方 App 完成现实任务,同期 Gemini 月活突破 9 亿。
Gemini Spark 的 Mac 上线是 Google 在"AI 代理落地"战略上的重要节点。此前 Spark 仅在移动端运行,此次扩展至 Mac 桌面 App 意味着用户可以在工作环境中直接调用代理能力。更关键的是第三方应用集成:Spark 现在可以代用户在 Canva 设计海报、在 Instacart 下单采购、在 OpenTable 预订餐厅、在 Zillow Rentals 查找公寓,这些操作不再需要用户手动切换 App 和输入信息。
从技术路径看,Spark 的跨 App 操控依赖于 Google 与第三方开发者共建的 API 协议层,而非屏幕截图识别式的通用 RPA 方案。这种"原生集成"路径虽然需要逐个谈判合作,但稳定性和操控精度更高,更适合商业场景的规模化部署。Gemini 月活突破 9 亿、覆盖 230 国 70 种语言的数据,则为这一生态扩张提供了用户基础支撑——更大的用户盘意味着更多开发者愿意投入精力接入 Spark 生态。
对于开发者和企业,Gemini Spark 的开放是一个值得关注的生态机会。将自己的 App 接入 Spark 可以获得来自 9 亿月活用户的自然分发;同时,Spark 的 Mac 端扩展也意味着企业内部工作流自动化场景有了新的实现路径,尤其是涉及多个 SaaS 工具协同的复杂流程。建议关注 Google 即将更新的 Gemini Spark API 开放文档。
来源: TechCrunch 报道 · Google Blog
5. DeepSeek V4 官版 7 月中旬上线,510 亿元首轮融资刷新中国 AI 纪录
一句话: DeepSeek 宣布 V4 官版 7 月中旬正式上线,同期完成 510 亿元首轮外部融资,估值约 4000 亿元,旧 API 接口将于 7 月 24 日废弃。
DeepSeek V4 自预览版发布以来一直是国内外 AI 开发者关注的焦点。6 月 29 日,DeepSeek 宣布 V4 官方正式版将于 7 月中旬上线,并同步引入"峰谷计费机制"——这意味着 API 定价将根据使用时段动态调整,低峰时段的调用成本有望进一步降低,高峰时段则可能产生溢价。这一定价模式在国内云计算市场已有先例,但在 AI API 领域的大规模落地尚属首次,将为企业用户的成本管理带来新的灵活性。
融资层面,DeepSeek 完成了总计 510 亿元(约合 70 亿美元)的首轮外部融资,估值约 4000 亿元,成为中国 AI 领域迄今规模最大的单轮融资之一。这笔资金的注入一方面验证了资本市场对 DeepSeek 技术路线和商业潜力的高度认可,另一方面也将为其在算力基础设施、研究团队扩张和国际化布局上提供充足弹药。值得关注的是,DeepSeek 此前一直以低调、自筹资金的方式运营,此次引入外部融资标志着其战略重心的重要转变。
对于当前正在使用 DeepSeek API 的开发者,最紧迫的行动是在 7 月 24 日前完成接口迁移:原 deepseek-chat 和 deepseek-reasoner 接口名称将被废弃,对应功能分别迁移至 deepseek-v4-flash 的非思考模式和思考模式。建议提前在测试环境验证新接口的兼容性,避免生产环境中断。V4 官版上线后的性能基准和实际推理成本,也将是判断是否值得将工作流从其他 LLM 迁移至 DeepSeek 的关键参考。