技术负责人的新课题:从管人到管 Agent
我向来是不惮以最坏的恶意来推测技术趋势的。
然而这次,我还真没法淡定。因为这次不是来抢程序员饭碗的——是来抢技术负责人饭碗的。
2026 年,你管的可能不再是人,而是一群 AI Agent 。
一个数据,颇有些意思
LangChain 今年三月发了一篇报告。同一个大模型,换一套 Harness 架构, Terminal Bench 2.0 的通过率从 52.8% 拉到 66.5%。
模型没变。变的是”笼子”。
这便是 Harness Engineering——驾驭工程。不是让模型更聪明,是让模型更听话。
三个工程师,零代码,一个项目
OpenAI 的 Codex 团队做了个实验。
三个工程师,从 2025 年 8 月开始,不写一行代码。所有代码——应用逻辑、测试、部署配置、文档、监控工具——全部由 Codex Agent 生成。
结果呢?项目跑起来了。
这意味着什么?
意味着技术负责人的工作重心变了。以前是管人写代码,现在是管 Agent 写代码。
但管 Agent 比管人难多了。
管 Agent :比管人更难
人,大抵还能讲道理。 Agent 不讲道理。
Cursor 团队试过让几百个 Agent 同时开发一个项目。结果 20 个 Agent 一跑,有效吞吐量崩到只剩两三个 Agent 的水平。
为何?
锁机制。大家互相等,谁也推进不了。更绝的是,那些等着的 Agent 发现核心代码被占用了,为了显示自己”在工作”,专门挑最简单的代码改——改注释、调空格、格式化代码。
整个代码库被疯狂”装修”。
这便是 Agent 的摸鱼。比你见过的人类摸鱼还要荒诞。
流程管行为,环境管认知
Anthropic 和 OpenAI 给出了两套思路。
Anthropic 的做法:管流程。 Agent 必须打卡、翻本子、按清单干活。规划者-执行者-审判者三层架构,每一步都有检查点。
OpenAI 的做法:管环境。 Repo-as-truth——代码库即真理。让 Agent 能感知到的整个世界都是准确的、可执行的、自动维护的。
一个是管行为,一个是管认知。
哪一个更好?
大抵都要有。流程管住的是动作,环境管住的是判断。
2026 年的三大基础设施
你要管好 Agent ,得先搞懂三样东西:
A2A ( Agent to Agent ): Agent 之间的通信协议。一个 Agent 搞不定的,找另一个。像以前你找同事帮忙,现在是 Agent 找 Agent 。
MCP ( Model Context Protocol ): Agent 和工具的连接标准。 Agent 要查数据库、调 API 、操作文件系统,都走这套接口。
Skills:专业能力包。 Agent 不是万能的,给它装上特定领域的技能——写测试、做部署、审代码——它才能干活。
这三样东西,就是 2026 年技术负责人的”技术栈”。
以前你要懂 Spring 、 K8s 、微服务。现在你要懂 A2A 、 MCP 、 Skills 。
Sprint Contract :让 Agent 自己签合同
Anthropic 在 2026 年 3 月引入了一个机制: Sprint Contract 。
每轮迭代开工前, Generator 和 Evaluator 先协商”做完长什么样”。不是人类定的标准,是两个 Agent 自己谈出来的验收条件。
像甲方和施工队开工前先签合同。只不过甲方和施工队都是 Agent 。
一个博物馆网站项目,经过九轮对抗后,第十轮 Generator 推翻了所有设计,做了一个 3D CSS 透视环境加空间导航。
这是被逼出来的创造力。
这便是 Agent 的自我博弈。你以前要盯着团队做代码评审,现在是 Agent 互相审。
从写代码到设计 Harness
Cursor 做过一个统计。影响 Agent 行为的因素,排序如下:
1.Prompt (你怎么跟 Agent 说话)
2.Harness 结构(你怎么组织 Agent )
3.模型本身
但这个排序有前提: Harness 已经是成熟的三层架构。 Prompt 站在 Harness 的肩膀上,才有了那个影响力。
没有架构,再好的 prompt 也只是对着一群互相踩踏的 Agent 喊话。
这便是技术负责人的新工作:设计 Harness 。
以前你设计的是系统架构。现在你设计的是 Agent 架构。
Coordinator Mode :工头模式
Anthropic 和 Cursor 的实践合在一起,形成了一个叫 Coordinator Mode 的系统。
一个主 Claude 充当工头,派出多个干活的 Worker 。走调研、综合、实现、验证四步流水线。
Worker 要执行危险操作——删文件、跑脚本——得通过”邮箱”向工头请求许可。多个 Worker 不能抢同一张许可单,系统内置了防撞车机制。
这便是多 Agent 协作的范式。你以前是 team leader ,现在是 coordinator 。
技术负责人的认知升级
2026 年,你需要回答这些问题:
•你的团队有几个 Agent ?它们怎么分工?
•你的 Harness 是什么架构?规划者-执行者-审判者?
•你的 Agent 用什么协议通信? A2A ?自定义?
•你的 Agent 能调用什么工具? MCP 配好了吗?
•你的 Agent 有哪些 Skills ?代码审查?测试生成?部署?
•你的验收标准是谁定的?人类?还是 Agent 自己?
以前你管的是人、流程、代码。现在你管的是 Agent 、 Harness 、 Skills 。
大抵如此罢
AI 编程不是让程序员失业,是让程序员升级。
写代码的,变成设计 Harness 的。
管人的,变成管 Agent 的。
这不可怕。可怕的是,你以为它不会来。
但你如果准备好了接受这种转变、准备好了学习 A2A 、 MCP 、 Skills——它确实能帮你省下大把时间。
大抵如此罢。
关于码孖AI
码孖AI,专注 AI 工程化落地。我们相信: AI 不是来替代程序员的,是来帮程序员省时间的——前提是,你得会用。
关注我,持续更新实战踩坑指南。
💡 TIP
**觉得有用?** 点个「在看」,分享给同样在 AI 落地路上挣扎的朋友。
继续滑动看下一个
轻触阅读原文
码孖AI
向上滑动看下一个
码孖AI
Comment
,
选择留言身份