技术负责人的新课题：从管人到管 Agent

我向来是不惮以最坏的恶意来推测技术趋势的。

然而这次，我还真没法淡定。因为这次不是来抢程序员饭碗的——是来抢技术负责人饭碗的。

2026 年，你管的可能不再是人，而是一群 AI Agent 。

一个数据，颇有些意思

LangChain 今年三月发了一篇报告。同一个大模型，换一套 Harness 架构， Terminal Bench 2.0 的通过率从 52.8% 拉到 66.5%。

模型没变。变的是”笼子”。

这便是 Harness Engineering——驾驭工程。不是让模型更聪明，是让模型更听话。

三个工程师，零代码，一个项目

OpenAI 的 Codex 团队做了个实验。

三个工程师，从 2025 年 8 月开始，不写一行代码。所有代码——应用逻辑、测试、部署配置、文档、监控工具——全部由 Codex Agent 生成。

结果呢？项目跑起来了。

这意味着什么？

意味着技术负责人的工作重心变了。以前是管人写代码，现在是管 Agent 写代码。

但管 Agent 比管人难多了。

管 Agent ：比管人更难

人，大抵还能讲道理。 Agent 不讲道理。

Cursor 团队试过让几百个 Agent 同时开发一个项目。结果 20 个 Agent 一跑，有效吞吐量崩到只剩两三个 Agent 的水平。

为何？

锁机制。大家互相等，谁也推进不了。更绝的是，那些等着的 Agent 发现核心代码被占用了，为了显示自己”在工作”，专门挑最简单的代码改——改注释、调空格、格式化代码。

整个代码库被疯狂”装修”。

这便是 Agent 的摸鱼。比你见过的人类摸鱼还要荒诞。

流程管行为，环境管认知

Anthropic 和 OpenAI 给出了两套思路。

Anthropic 的做法：管流程。 Agent 必须打卡、翻本子、按清单干活。规划者-执行者-审判者三层架构，每一步都有检查点。

OpenAI 的做法：管环境。 Repo-as-truth——代码库即真理。让 Agent 能感知到的整个世界都是准确的、可执行的、自动维护的。

一个是管行为，一个是管认知。

哪一个更好？

大抵都要有。流程管住的是动作，环境管住的是判断。

2026 年的三大基础设施

多 Agent 协作架构

你要管好 Agent ，得先搞懂三样东西：

A2A （ Agent to Agent ）： Agent 之间的通信协议。一个 Agent 搞不定的，找另一个。像以前你找同事帮忙，现在是 Agent 找 Agent 。

MCP （ Model Context Protocol ）： Agent 和工具的连接标准。 Agent 要查数据库、调 API 、操作文件系统，都走这套接口。

Skills：专业能力包。 Agent 不是万能的，给它装上特定领域的技能——写测试、做部署、审代码——它才能干活。

这三样东西，就是 2026 年技术负责人的”技术栈”。

以前你要懂 Spring 、 K8s 、微服务。现在你要懂 A2A 、 MCP 、 Skills 。

Sprint Contract ：让 Agent 自己签合同

Anthropic 在 2026 年 3 月引入了一个机制： Sprint Contract 。

每轮迭代开工前， Generator 和 Evaluator 先协商”做完长什么样”。不是人类定的标准，是两个 Agent 自己谈出来的验收条件。

像甲方和施工队开工前先签合同。只不过甲方和施工队都是 Agent 。

一个博物馆网站项目，经过九轮对抗后，第十轮 Generator 推翻了所有设计，做了一个 3D CSS 透视环境加空间导航。

这是被逼出来的创造力。

这便是 Agent 的自我博弈。你以前要盯着团队做代码评审，现在是 Agent 互相审。

从写代码到设计 Harness

Cursor 做过一个统计。影响 Agent 行为的因素，排序如下：

1.Prompt （你怎么跟 Agent 说话）

2.Harness 结构（你怎么组织 Agent ）

3.模型本身

但这个排序有前提： Harness 已经是成熟的三层架构。 Prompt 站在 Harness 的肩膀上，才有了那个影响力。

没有架构，再好的 prompt 也只是对着一群互相踩踏的 Agent 喊话。

这便是技术负责人的新工作：设计 Harness 。

以前你设计的是系统架构。现在你设计的是 Agent 架构。

Coordinator Mode ：工头模式

Anthropic 和 Cursor 的实践合在一起，形成了一个叫 Coordinator Mode 的系统。

一个主 Claude 充当工头，派出多个干活的 Worker 。走调研、综合、实现、验证四步流水线。

Worker 要执行危险操作——删文件、跑脚本——得通过”邮箱”向工头请求许可。多个 Worker 不能抢同一张许可单，系统内置了防撞车机制。

这便是多 Agent 协作的范式。你以前是 team leader ，现在是 coordinator 。

技术负责人的认知升级

2026 年，你需要回答这些问题：

•你的团队有几个 Agent ？它们怎么分工？

•你的 Harness 是什么架构？规划者-执行者-审判者？

•你的 Agent 用什么协议通信？ A2A ？自定义？

•你的 Agent 能调用什么工具？ MCP 配好了吗？

•你的 Agent 有哪些 Skills ？代码审查？测试生成？部署？

•你的验收标准是谁定的？人类？还是 Agent 自己？

以前你管的是人、流程、代码。现在你管的是 Agent 、 Harness 、 Skills 。

大抵如此罢

从管人到管 Agent

AI 编程不是让程序员失业，是让程序员升级。

写代码的，变成设计 Harness 的。

管人的，变成管 Agent 的。

这不可怕。可怕的是，你以为它不会来。

但你如果准备好了接受这种转变、准备好了学习 A2A 、 MCP 、 Skills——它确实能帮你省下大把时间。

大抵如此罢。

关于码孖AI

码孖AI，专注 AI 工程化落地。我们相信： AI 不是来替代程序员的，是来帮程序员省时间的——前提是，你得会用。

关注我，持续更新实战踩坑指南。

💡 TIP

**觉得有用？** 点个「在看」，分享给同样在 AI 落地路上挣扎的朋友。

Like the Author

继续滑动看下一个

轻触阅读原文

码孖AI

向上滑动看下一个

码孖AI

Comment

选择留言身份