明明Agent是帮手,为什么我们却越来越累?

公众号一年多没更新了,不是因为懒,也不是因为自己没有跟上技术的步伐,而是因为有个执念,AI变强之后,技术博客本身的价值就大幅降低,大家学习的方式已经从搜索-学习变成了直接与AI对话的交互式学习。此外由于AI能力的加持,太多AI生成的公众号内容会第一时间发布一些内容,让我觉得步人后尘倒也没有太大必要。从博客的访问量上来看,最近一年的访问量也骤跌,更没有了花几小时写一篇文章的兴致。我更怀念那些一个字一个字几个小时甚至几天码出来的一篇博文的时光。

最近半年AI工具有了长足进步,作为重度用户,聊聊”明明Agent是我们的帮手,为什么却感觉越来越累?”

现在的工作流

现在一个feature从头到尾都有Agent参与。可行性评估让它先调研一轮,技术方案让它出个初稿,实现直接让它写,测试也让它补。每个环节你都还在,但角色变了——从自己动手变成了审方案、审代码、审测试。以前写、调、测、部署整个链路自己走,虽然慢,但系统每个细节都熟悉。现在你对着Agent的输出做审核,效率是高了,但一天下来比以前还累。

一个人带几个“不靠谱的新人”

累的核心在这儿:你同时在并行管理好几个Agent任务。A session做A的feature,B session做B的,C在跑测试。A做完了你切过去review,刚搞明白它为什么这么写,B也好了。每次切换你都得重新建立上下文,而且是别人写的代码的上下文,比切自己的代码累得多。

关键是这几个"新人"速度特别快。新人一天甚至几天做完的事情,Agent可能几分钟就交了,你还没审完上一个,下一个又来了。真带几个新人你可以控制节奏,跟他们说"这个不急明天再搞"。Agent不会等你,它只管产出,你就一直被它push着走——审完这个审下一个,永远有东西在等你看。不是你在用工具,是工具在驱动你。

审核和验证困难

有句老话说,世界上有两种代码:一种明显没有错误,一种没有明显错误。Agent写出来的基本都是后者。

这里有个根本的悖论:你用Agent就是为了提效,但要确保它的输出没问题,你就得花大量时间审核。审得越细越安全,但效率优势就越小;管得越松效率越高,但出问题的概率就越大。而且问题往往不是简单的幻觉,而是源自顶层设计:架构选型合不合理、抽象层次对不对、跟现有系统的边界清不清楚。这些东西测试未必能覆盖到,只有人能判断。

活更多了

Agent什么都能写,老板也知道。于是本来不属于你的活开始往你这儿分。以前做后端的就做后端,前端有前端的人,数据有数据的人。现在老板觉得你有Agent加持,改个前端组件也不是什么大事吧?调个数据pipeline也能搞吧?每一块你都不算陌生但也不算精通,Agent写出来的东西你得看,但底气没那么足。以前不会的东西可以说"这不是我的领域",现在Agent帮你接了,想推都推不掉。

追不完的工具链

再说工具本身。这一年,Cursor从tab补全进化到background agent,Claude Code从勉强能用到现在能跑整个feature,各种MCP server冒出来一堆,OpenAI和Google几巨头不断推出新模型,还有一堆创业公司每周发新东西。群里"XX工具彻底改变了我的工作流"之类的文章此起彼伏,不试试心里不踏实,试了又发现不过如此。

方法论也在跟着变。从最早的Prompt Engineering到如今的Harness Engineering,Skill怎么写、context怎么喂、多Agent如何编排、Plan模式什么时候用……这些东西没有标准答案,今天的最佳实践明天可能就过时了。以前一个IDE用三五年,现在三五个月工具链就换一轮。有时候怀疑,学这些轮子和造这些轮子花掉的精力,已经超过了轮子本身带来的效率提升。

成长变慢了

以上说的都是当下的累。还有个更长期的事:每天的learning变少了。以前实现一个功能得读文档、翻源码、搞懂底层原理,现在Agent直接给你结果,活干完了,但那些本该顺带发生的学习没了。以前一个功能从调研到上线全程自己做,做完之后那种"这东西我完全掌握了"的感觉很踏实,现在这种完整的掌控感越来越少了。每天产出在涨,但成长在放缓。


所以回到开头的问题,为什么越来越累?审不完的代码、推不掉的活、追不完的工具、停不下来的节奏,再加上成长的掌控感在流失。Agent提效是真的,但这些代价也是真的。

以为招了个助理,其实是多了几个需要你带的不靠谱下属。而且它不下班。