1. iOS 27 AI Extensions:Claude 首次可替代 Siri 成 iPhone 默认 AI
一句话: 6月9日 WWDC 2026,Apple 宣布 iOS 27 引入 AI Extensions,用户可将 Claude、ChatGPT 或 Gemini 设为 iPhone 跨系统默认 AI 助手,Siri 底层由苹果以约10亿美元/年授权的 Gemini 定制模型驱动。
在 WWDC 2026 开幕主题演讲中,Tim Cook 走上台宣布了 Apple 历史上最大规模的 AI 生态开放:iOS 27 将引入「AI Extensions」系统,允许用户在「设置」中将第三方 AI 助手设为覆盖整个系统的默认 AI 服务提供商。Claude、ChatGPT、Google Gemini 和 Grok 均在首批支持名单中,用户可逐功能区选择偏好的 AI 引擎——例如写作辅助用 Claude,代码建议用 ChatGPT,搜索增强用 Gemini。
这一开放的背后是苹果的双轨策略:Siri 本身由 Apple Intelligence 架构重构,底层采用 Google 授权的 1.2 万亿参数定制 Gemini 模型,据报道年授权费约 10 亿美元,使 Siri 具备了更流畅的多轮对话能力;与此同时,通过 Extensions 系统将更复杂的多步骤任务或用户主动触发的 AI 请求路由给第三方。两套系统在 iOS 27 的「Apple Intelligence」伞形框架下并存,苹果在中间扮演「AI 路由器」的角色。
对开发者的影响尤为深远。Apple Foundation Models 框架同步公布,Anthropic 确认 Claude 将通过该框架在 iOS 27、iPadOS 27、macOS 27 及 visionOS 27 中可用。这意味着开发者可以通过标准 API 调用将 Claude 能力嵌入原生 App,无需单独处理网络请求或用户鉴权——Claude 的能力直接成为 iOS 系统的一部分。对于已经在 App 中集成 Anthropic API 的团队,Apple 的分发网络意味着潜在用户基数直接跃升至 10 亿+ 量级。
> 来源: TechCrunch WWDC 2026全记录 · AI Weekly iOS 27 Extensions
---
2. OpenAI 收购德国初创 Ona,Codex 迈向跨天长时间异步任务
一句话: 6月11日,OpenAI 宣布收购德国云环境公司 Ona(原 Gitpod),其持久化云执行技术将让 Codex 智能体可以在用户关机后继续运行数小时乃至数天,彻底改变 AI 编程助手的任务边界。
6月11日,OpenAI 在官网正式公告收购 Ona(前身为 Gitpod,2019年创立于德国基尔市)。Ona 的核心产品是为开发者提供安全、可复现的预配置云执行环境,已服务超过 200 万开发者。在 AI 时代,Ona 将这套基础设施重新定向为专为 AI 智能体设计的云沙盒:每个 Agent 执行会话都在一个隔离、预装工具和上下文的云环境中运行,即使用户的本地设备断开连接,任务也可以持续推进。
OpenAI 收购 Ona 的战略意图指向一个核心问题:Codex 当前的能力边界是分钟级任务,而大多数真正有价值的软件工程工作——重构一个旧系统、运行一套大型集成测试、升级数百个模块的依赖——需要数小时乃至数天。有了 Ona 的技术,Codex 智能体可以在夜间独立完成这些任务,次日早晨开发者打开电脑时看到的是已完成的 PR,而不是等待确认的进度弹窗。
另一个被广泛关注的维度是数据主权。Ona 的「客户控制执行」模型允许 Codex 任务运行在客户自己的 AWS、Azure 或 GCP 环境中,OpenAI 只提供模型智能和编排逻辑,计算和数据全程不离开客户的云账户。这对企业用户尤为重要——金融、医疗、法律等受严格合规约束的行业,此前因数据安全顾虑对 AI 编程智能体持保守态度,Ona 的模型直接化解了这一障碍。
> 来源: OpenAI 官方公告 · CNBC
---
3. Gemini 3.5 Pro 本月发布在即:200万 Token 上下文 + Deep Think 深度推理
一句话: 继5月推出 Gemini 3.5 Flash 后,Google 确认旗舰版 Gemini 3.5 Pro 将于2026年6月正式发布,主打200万 token 超长上下文和「Deep Think」推理模式,目前已在 Google AI Studio 小范围预览。
今年5月19日,Google 在 I/O 2026 大会上发布了 Gemini 3.5 Flash,这款模型在代码、Agent 和多模态基准上超越了去年的 Gemini 3.1 Pro,API 定价为 $1.50/$9(输入/输出,每百万 token)。但这只是 Google 战略的前半场——Flash 主打速度和经济性,Pro 才是真正的旗舰对决。
根据 TechTimes 的报道和 Google AI Studio 预览信息,Gemini 3.5 Pro 的两个核心差异化能力已经基本明确:第一是 200 万 token 的上下文窗口,这是目前主流商用模型中最长的,超过 Claude Fable 5(100万)和 GPT-5.4(约 128K)的两倍;第二是「Deep Think」深度推理模式,允许模型在回答前进行多步扩展推理,类似 OpenAI o3 和 Anthropic 的自适应思维,但与 Gemini 原有的强项多模态理解结合,使其在科学推理、长文档分析等场景上具备独特优势。
对于实际使用场景,200万 token 上下文意味着可以一次性送入整个大型 monorepo 的源代码、完整的法律合同包或数十份研究报告进行综合分析。这对工程团队的影响是:代码 review 助手可以真正理解整个系统上下文而不是单一文件;对法律和咨询团队的影响是:可以让模型同时读完所有相关文件再给出建议,而不是分批处理拼接结果。Pro 的 API 定价预计高于 Flash,目前尚未公布,但据业内人士预测可能在 $5-10/百万 token 区间,与 Claude Fable 5 API 定价直接竞争。
> 来源: TechTimes · TechCrunch Gemini 3.5 Flash
---
4. GPT-5.4 mini 面向免费用户开放,ChatGPT 超级应用化提速
一句话: OpenAI 将 GPT-5.4 mini 推向 ChatGPT 免费与 Go 用户,同步上线 70+ 互动学习模块和企业工作区智能体,ChatGPT 正从聊天机器人向覆盖学习、工作、代码的全能超级应用演进。
GPT-5.4 mini 是 GPT-5.4 家族中为高并发、低延迟场景设计的精简版,在 SWE-bench Pro(软件工程基准)上得分 54.4%,与完整版 GPT-5.4 的 57.7% 差距仅 3 个百分点,但成本约低 6 倍,延迟显著更低。此前,推理模型仅对 Plus 和 Pro 付费用户开放;此次将 mini 版本通过 ChatGPT「+」菜单中的 Thinking 开关下放至免费层,是 OpenAI 超级应用战略中「用高质量免费体验锁定用户」逻辑的核心一步。
与模型更新同步的,是 ChatGPT 多个产品能力的叠加上线。互动学习模块(Interactive Learning)首批支持 70+ 数学与科学主题,用户可以在对话中实时操纵公式变量、可视化物理方程,从被动阅读转向主动实验——这一功能对 K-12 与大学生用户的吸引力尤为显著。企业版和教育版则新增工作区智能体(Workspace Agents),团队可以将跨工具的自动化工作流共享给成员,让智能体代替人工处理重复审批、报告汇总、代码检查等流程。此外,ChatGPT Lockdown Mode 也在本轮更新中向全体登录用户开放,通过限制外部服务访问来防范 prompt injection 攻击导致的数据泄露。
值得开发者关注的是一个重要的退役时间线:GPT-4.5 将在6月27日从 ChatGPT 下线,GPT-5.4 mini 以及 GPT-5 系列正式成为新基线。对于仍在调用 gpt-4.5-preview 等旧接口的项目,需在两周内完成迁移测试,切换到 gpt-5.4-mini 或 gpt-5.4,否则将面临接口不可用的风险。OpenAI 的 Responses API(为 Agent 场景设计的新版 API,内置 web search、file search 和 computer use 工具)也已正式发布,建议新项目直接采用。
> 来源: OpenAI GPT-5.4 介绍 · NxCode GPT-5.4 指南
---
5. Snap 裁员千人:AI 写65%代码省5亿美元,IT 就业冲击加速
一句话: Snap 宣布裁员约1000人(占全职员工16%),AI 目前生成超过65%的新代码,全年化成本节省预计超5亿美元,股价应声上涨——「AI 效率红利」正成为资本市场定价科技股的新逻辑。
Snap CEO Evan Spiegel 在内部信中将此次裁员定性为公司面临的「关键时刻」(crucible moment):随着 AI 工具在工程团队中的渗透率提升,公司发现可以用更精简的团队完成同等甚至更高质量的产出。具体数字令业界震动——Snap 的 AI 代码生成率已超过65%,高于此前 GitHub 等公司披露的行业均值,直接导致对初中级工程师的需求大幅下降。裁员波及约1000名全职员工,同时关闭逾300个开放职位,并按需缩减承包商规模。
从资本市场反应来看,Snap 宣布裁员后股价上涨,投资者将这笔每年5亿美元的成本节省解读为利润改善的先行指标。这一模式正在复制:Salesforce、Duolingo、IBM 等多家公司在同期也相继公布了以「AI 效率」为由的裁员或招聘冻结计划。AI 驱动裁员已经从个案演变为一种系统性的企业财务战略——「AI 写码省成本」不再是技术部门的内部指标,而是 CFO 报告里的竞争力叙事。
对 IT 从业者的警示已经足够清晰:当一家公司65%的代码由 AI 产出时,「写代码」本身的稀缺性正在快速稀释。真正难以被 AI 替代的是系统架构决策、产品技术对齐、AI 输出的质量鉴别以及跨团队的工程协调能力。对个人职业路径来说,Copilot/Cursor/Claude Code 等工具的熟练使用不再是加分项而是基础门槛;对团队领导者而言,Snap 案例提供了一个现成的 ROI 模型,可直接用于向管理层论证 AI 工具投入的财务回报。
> 来源: CNBC Snap 裁员 · Fox Business