测试Agent,别只看介绍。
我现在更常用的办法,是拿一个自己熟悉、结果相对确定的项目,让不同Agent都做一遍。同一个输入,同一个目标,同一套约束,差异很快就出来了。
有的Agent适合开局,能把问题拆清楚;有的适合执行,给它计划就能一路做下去;有的适合审查,能帮你发现执行里漏掉的边界。
所以,多Agent协作不是比谁最强,而是看谁适合坐在哪个位置。
更好的方式,是让一个理解力强的Agent先写计划,让执行Agent按计划做,再让审查Agent检查结果。这样任务才容易闭环。
AI时代真正要练的,不只是学会某个工具,而是把这些工具放进自己的工作系统里。