logo
图片

连续看了几篇 OpenAI关于Codex的文章,看完以后,最强烈的感受不是“AI太强了”,而是另一种更具体的震动:以后最值钱的能力,可能不再只是把代码一行行敲出来,而是把一套让AI稳定干活的系统搭起来。


这个东西,OpenAI现在给了一个名字,叫 "Harness Engineering",控制环工程。很多人第一次听到这个词,会以为又是什么新瓶装旧酒。


但是,OpenAI 内部有个 team,花了5个月时间,做出了一个真实的生产级产品。

代码量:超过100万行。人工手写代码:0行。全程由 AI Agent 完成,人类工程师做的事情只有一件——设计让 AI 能可靠工作的"系统"


题为“在本地开发中赋予 Codex 完整的可观察性堆栈”的图表。一个应用程序将日志、指标和追踪数据发送到 Vector,Vector 会将数据分发到一个包含 Victoria Logs、Metrics 和 Traces 的可观测性堆栈中,并通过 LogQL、PromQL 或 TraceQL API 进行查询。Codex 使用这些信号进行查询、关联和推理,然后在代码库中进行修复,重启应用程序,重新运行工作负载,测试 UI 流程,并在反馈循环中重复此过程。


这套系统,现在有了一个正式的名字:Harness Engineering。


🐴 Harness 是什么意思?


Harness 这个词来自马具——就是驾驭马匹的缰绳、马鞍、嚼子那一整套装备。

类比放到 AI 上,意思很直白:

AI 模型是那匹马——跑得快,但不知道往哪跑。 Harness 是那套马具——约束它、引导它、让它真正有用。



技术上来说,Harness 是包裹在 AI Agent 外面的那层基础设施,负责管理:

  • 工具调用(Tool Use)
  • 上下文记忆(Context / Memory)
  • 错误重试(Retry)
  • 人工审批节点(Human-in-the-loop)
  • 架构约束和代码规范检查


简单说:Agent 是"执行者",Harness 是"操作系统"。

如果 LLM 是 CPU,Harness 就是 OS。


📊 为什么说 Harness 比模型本身更重要?

今年3月有研究数据出来了:

同一个 AI 模型,有 Harness vs 没有 Harness,coding benchmark 成功率:78% vs 42%。

差距不来自模型,完全来自外面那套系统的设计。


🔄 这改变了什么?


过去大家讨论 AI 编程,焦点在:

哪个模型更聪明?Prompt 怎么写更好?


2026年,问题变成了:

你的 Harness 长什么样?


OpenAI、Anthropic——这些顶级机构和公司,正在独立得出同一个结论:

模型只是引擎,Harness 才是方向盘和安全系统。

工程师的角色,正在从"写代码的人",变成"设计让 AI 可靠写代码的系统的人"。


OpenAI unveils new measures as frontier AI grows cyber-powerful


💡 想深入做 Harness Engineering,得先把地基打好

Harness Engineering 是 AI Engineer 成长到一定阶段之后自然面对的课题。


它的前提是你已经能构建 Agent,已经理解 RAG、MCP、LLMOps 这些底层机制,才有资格去谈"怎么让 Agent 在生产环境里稳定、可控地运作"。


换句话说,它不是入门内容,而是建立在扎实 AI 工程基础之上的进阶能力。

所以问题就变成了:这些基础,你有吗?

  • 能从零搭一个 RAG 系统吗?

  • 懂 LangChain / LangGraph 怎么编排 Agent 吗?

  • 知道 MCP 是什么、怎么构建 MCP Server 吗?

  • 部署到生产环境之后,怎么用 LangSmith、RAGAS 做监控和评估?


如果这些还是模糊的,那 Harness Engineering 对你来说就还是一个"听起来很厉害但不知道怎么入手"的概念。


这正是匠人学院 AI Engineer 训练营想帮你解决的问题。


匠人学院即将开启05期 AI Engineer 训练营

全球唯一面向华人developer的AI Engineer实战课

专门为希望突破薪资天花板

或者是想转型的开发者打造!

图片


课程从 LLM 基础出发,覆盖 Prompt Engineering、RAG 系统搭建、LangChain / LangGraph Agent 开发、MCP Server 构建、Multi-Agent 架构设计,再到 LangSmith + RAGAS 监控评估和上云部署——打完这套基础,你才真正站在了 AI Engineer 的起跑线上,也才有能力去理解和实践 Harness Engineering 这个方向。


图片


他们的技术栈通常包括四个方向:

Prompt Engineering(提示词工程)

学会如何与大模型对话,精准控制输出逻辑。

这不仅是写Prompt,更像是在训练AI“听懂你说话”。


RAG系统(Retrieval-Augmented Generation)

把企业知识库接入AI,让模型能“带资料地思考”。

这项技术已经成为全球AI应用的基础架构。


Agent框架(LangChain / LangGraph)

构建多智能体系统(Multi-Agent),让AI具备任务规划与协作能力。


部署与监控(LLMOps / MLOps)

把AI从测试环境上线到生产环境,确保性能、安全与成本可控。


👇那这个训练营到底会教什么?


在本课程中,您将学习如何根据最佳实践原型设计LLM应用,并基于生成式AI的四大核心模式:Prompt Engineering(提示工程)、Retrieval Augmented Generation (RAG)(检索增强生成)、大语言模型(LLM)和Embeddings,以及Agents进行开发。同时,您无需绑定于单一云计算供应商,课程将使用Python和核心版本控制工具LangChain,从零构建系统。LangChain 是构建生产级LLM应用的领先框架。


图片


图片
图片


图片


课程覆盖的技术栈,是直接对标真实招聘JD拆解出来的——RAG系统、AI Agent、LangChain、MCP、Fine-tune Llama 3.1、Vector Database、LLM Ops监控,每一项都能在招聘需求里找到对应。


如果你已经准备为职业发展加一把火、或者想提高薪资竞争力,这门课会是最快、最有效的方式。想了解课程?扫码即可👇


图片

也可以私戳我聊聊你的职业路线

我能给你一些很实用的方向建议!

图片

JR Academy · Blog职业洞察

OpenAI悄悄定义了下一个风口:HarnessEngineering

连续看了几篇OpenAI关于Codex的文章,看完以后,最强烈的感受不是“AI太强了”,而是另一种更具体的震

发布日期
阅读时长1 分钟
作者
图片

连续看了几篇 OpenAI关于Codex的文章,看完以后,最强烈的感受不是“AI太强了”,而是另一种更具体的震动:以后最值钱的能力,可能不再只是把代码一行行敲出来,而是把一套让AI稳定干活的系统搭起来。


这个东西,OpenAI现在给了一个名字,叫 "Harness Engineering",控制环工程。很多人第一次听到这个词,会以为又是什么新瓶装旧酒。


但是,OpenAI 内部有个 team,花了5个月时间,做出了一个真实的生产级产品。

代码量:超过100万行。人工手写代码:0行。全程由 AI Agent 完成,人类工程师做的事情只有一件——设计让 AI 能可靠工作的"系统"


题为“在本地开发中赋予 Codex 完整的可观察性堆栈”的图表。一个应用程序将日志、指标和追踪数据发送到 Vector,Vector 会将数据分发到一个包含 Victoria Logs、Metrics 和 Traces 的可观测性堆栈中,并通过 LogQL、PromQL 或 TraceQL API 进行查询。Codex 使用这些信号进行查询、关联和推理,然后在代码库中进行修复,重启应用程序,重新运行工作负载,测试 UI 流程,并在反馈循环中重复此过程。


这套系统,现在有了一个正式的名字:Harness Engineering。


🐴 Harness 是什么意思?


Harness 这个词来自马具——就是驾驭马匹的缰绳、马鞍、嚼子那一整套装备。

类比放到 AI 上,意思很直白:

AI 模型是那匹马——跑得快,但不知道往哪跑。 Harness 是那套马具——约束它、引导它、让它真正有用。



技术上来说,Harness 是包裹在 AI Agent 外面的那层基础设施,负责管理:

  • 工具调用(Tool Use)
  • 上下文记忆(Context / Memory)
  • 错误重试(Retry)
  • 人工审批节点(Human-in-the-loop)
  • 架构约束和代码规范检查


简单说:Agent 是"执行者",Harness 是"操作系统"。

如果 LLM 是 CPU,Harness 就是 OS。


📊 为什么说 Harness 比模型本身更重要?

今年3月有研究数据出来了:

同一个 AI 模型,有 Harness vs 没有 Harness,coding benchmark 成功率:78% vs 42%。

差距不来自模型,完全来自外面那套系统的设计。


🔄 这改变了什么?


过去大家讨论 AI 编程,焦点在:

哪个模型更聪明?Prompt 怎么写更好?


2026年,问题变成了:

你的 Harness 长什么样?


OpenAI、Anthropic——这些顶级机构和公司,正在独立得出同一个结论:

模型只是引擎,Harness 才是方向盘和安全系统。

工程师的角色,正在从"写代码的人",变成"设计让 AI 可靠写代码的系统的人"。


OpenAI unveils new measures as frontier AI grows cyber-powerful


💡 想深入做 Harness Engineering,得先把地基打好

Harness Engineering 是 AI Engineer 成长到一定阶段之后自然面对的课题。


它的前提是你已经能构建 Agent,已经理解 RAG、MCP、LLMOps 这些底层机制,才有资格去谈"怎么让 Agent 在生产环境里稳定、可控地运作"。


换句话说,它不是入门内容,而是建立在扎实 AI 工程基础之上的进阶能力。

所以问题就变成了:这些基础,你有吗?

  • 能从零搭一个 RAG 系统吗?

  • 懂 LangChain / LangGraph 怎么编排 Agent 吗?

  • 知道 MCP 是什么、怎么构建 MCP Server 吗?

  • 部署到生产环境之后,怎么用 LangSmith、RAGAS 做监控和评估?


如果这些还是模糊的,那 Harness Engineering 对你来说就还是一个"听起来很厉害但不知道怎么入手"的概念。


这正是匠人学院 AI Engineer 训练营想帮你解决的问题。


匠人学院即将开启05期 AI Engineer 训练营

全球唯一面向华人developer的AI Engineer实战课

专门为希望突破薪资天花板

或者是想转型的开发者打造!

图片


课程从 LLM 基础出发,覆盖 Prompt Engineering、RAG 系统搭建、LangChain / LangGraph Agent 开发、MCP Server 构建、Multi-Agent 架构设计,再到 LangSmith + RAGAS 监控评估和上云部署——打完这套基础,你才真正站在了 AI Engineer 的起跑线上,也才有能力去理解和实践 Harness Engineering 这个方向。


图片


他们的技术栈通常包括四个方向:

Prompt Engineering(提示词工程)

学会如何与大模型对话,精准控制输出逻辑。

这不仅是写Prompt,更像是在训练AI“听懂你说话”。


RAG系统(Retrieval-Augmented Generation)

把企业知识库接入AI,让模型能“带资料地思考”。

这项技术已经成为全球AI应用的基础架构。


Agent框架(LangChain / LangGraph)

构建多智能体系统(Multi-Agent),让AI具备任务规划与协作能力。


部署与监控(LLMOps / MLOps)

把AI从测试环境上线到生产环境,确保性能、安全与成本可控。


👇那这个训练营到底会教什么?


在本课程中,您将学习如何根据最佳实践原型设计LLM应用,并基于生成式AI的四大核心模式:Prompt Engineering(提示工程)、Retrieval Augmented Generation (RAG)(检索增强生成)、大语言模型(LLM)和Embeddings,以及Agents进行开发。同时,您无需绑定于单一云计算供应商,课程将使用Python和核心版本控制工具LangChain,从零构建系统。LangChain 是构建生产级LLM应用的领先框架。


图片


图片
图片


图片


课程覆盖的技术栈,是直接对标真实招聘JD拆解出来的——RAG系统、AI Agent、LangChain、MCP、Fine-tune Llama 3.1、Vector Database、LLM Ops监控,每一项都能在招聘需求里找到对应。


如果你已经准备为职业发展加一把火、或者想提高薪资竞争力,这门课会是最快、最有效的方式。想了解课程?扫码即可👇


图片

也可以私戳我聊聊你的职业路线

我能给你一些很实用的方向建议!

图片

作者
一键分享或复制链接

相关文章推荐

查看全部文章 →