我们面对的不是一个抽象的扫描问题,而是一个真实工作流问题。对话很多,执行很多,文章候选很多,多台电脑都有记录,博客和公众号又分别有状态。这个时候,如果扫描结果被当成结论,后面所有动作都会被带偏。
所以这篇文章真正要讲的,不是“扫描工具不可靠”。真正要讲的是,扫描只能负责发现,不能负责判断。AI 同事要做的,也不是把扫描结果直接写成文章,而是帮助我们拆堵点、清方向、定边界、留证据。
这件事听起来像内容管理,做起来更像一次协作系统校准。因为系统越复杂,越容易把“看见了什么”和“确认了什么”混在一起。扫描让我们看见可能性,但它还没有完成筛选、归类、脱敏、复核和发布判断。中间每一步都不能省。
扫描结果只是入口
最开始,我们问的是数量。之前候选池已经有几十篇文章候选,最近几天又做了很多事,也产生了很多对话。那现在到底还有多少可以写,已经写完多少,还能深挖多少,这些问题靠记忆回答很不稳。
扫描可以回答一部分。它可以告诉我们候选池里有多少条,可采纳多少条,A 类多少,B 类多少,C 类多少,D 类多少。这些数字有用,因为它们让混乱先有一个轮廓。但这些数字不能直接变成写作结论,因为扫描只是把可能性捞出来,还没有判断这些可能性能不能公开、值不值得写、是否已经重复。
真正麻烦的地方在这里。一个主题有没有重复,是不是已经写过,是否需要脱敏,是不是只适合内部留存,能不能拆成系列,应该由哪个流程发布,这些都不是普通扫描能直接决定的。扫描可以站在入口位置,接住素材,标出风险,但不能替后面的判断层做决定。
如果我们把扫描结果当成最终答案,就会出现一种很隐蔽的错觉:好像列表里有了标题,文章就已经差不多了。其实不是。标题只是最外层的壳,真正的内容价值还要看它背后的场景、判断链、证据和读者能拿走什么方法。
新增少,不等于内容少
这次一个明显堵点,是“最近对话很多,为什么候选只新增了一部分”。如果只看扫描结果,很容易误判,以为新增少就说明内容少,或者以为这几天没有太多值得写的东西。
但新增少可能有很多原因。很多内容被合并了,很多主题已经在候选池里,只是换了说法,很多大主题被扫描压成一个显性标题,没有继续拆成多个可写方向。比如围绕“对话写文章系统”,普通扫描可能只得到一两个候选,但深挖以后,它可以拆成候选池为什么不是待办清单、扫描结果为什么不能全信、多台电脑为什么可以采集但不能各写各的、为什么 accept 不能自动触发 write、为什么配图必须进入标准流程、为什么质量门不能被口头判断替代。
这些不是凭空扩写出来的文章,而是我们实际互动里一次次清出来的方向。扫描没有错,它只是没有把“一个大主题内部的多个分支”继续展开。AI 同事如果只读扫描数量,就会低估内容空间;如果能看扫描背后的结构,就会发现数字只是表面,结构才决定还有多少东西可写。
所以我现在更愿意把扫描看成地图的第一层。它告诉我们哪里有东西,但不告诉我们哪条路能走、哪条路危险、哪条路已经走过、哪条路值得继续走。要完成这些判断,就必须再往下做聚类和复核。
候选多,也不等于都能写
反过来,候选多,也不代表都能写。这是另一个堵点。候选池里有很多条目,但每条状态不一样。有些是 A 类,可以直接写;有些是 B 类,需要先脱敏;有些是 C 类,要回看来源;有些是 D 类,内部阻塞,不适合公开。
如果 AI 同事只看到“候选很多”,就开始排队写,会出问题。有的内容会重复,有的内容会暴露内部细节,有的内容会缺少来源,有的内容会把一个还没有判断清楚的执行记录,包装成一篇看似完整的文章。这就是扫描结果不能全信的第二层意思:扫描可以告诉我们“这里有一个候选”,但不能直接告诉我们“这篇现在就能发布”。
发布之前要过几个关。先看隐私,再看来源,再看相似度,再看文章角度,再看账号和平台,再看配图流程,再看质量门,再看草稿箱是否重复。每一关都不是形式主义,而是在防止系统把半成品当成成品。
这里的人,不只是我,也包括 AI 同事。AI 同事参与的不是机械执行,而是判断。它要知道什么时候应该继续写,什么时候应该停下来补证据,什么时候应该提醒我这个主题不能公开。这个判断越早发生,后面的返工越少。
扫描结果要被聚类
这次我们做 deep-dive tick 和 cluster 报告,就是为了补扫描的短板。扫描得到的是一条条候选,但写作系统需要的是一组组主题关系。如果不聚类,同一类主题会重复写,大主题会被压成小标题,最近刚写过的内容也可能再次进入写作队列。
比如“三台机器协作”“多 Agent 审稿”“AI 同事协作”这些标题,如果不看 cluster,很容易连续写出相似文章。每篇看起来都没错,但放在一起就会变成重复表达。读者看到的是同一个判断被换了几种说法,系统看到的是内容库被相似主题填满。
聚类的价值,是把散乱候选变成结构。AI 同事看到 cluster 后,才知道接下来应该写哪一类,不应该再重复哪一类,哪一类需要先补来源,哪一类可以作为系列继续展开。这一步不是装饰,它是在清方向。
更重要的是,聚类能帮我们看到主题之间的层级。有些候选适合作为总论,有些适合作为案例,有些适合作为方法,有些只适合作为内部备注。扫描把它们放在同一张表里,聚类则把它们放回各自的位置。
AI 同事要帮我们拆堵点
扫描结果不能全信,本质不是工具能力问题,而是协作方式问题。AI 同事如果只是拿扫描结果去写文章,还是不够。它要先帮我们判断,当前堵点是什么:是数量看不清,还是重复看不清;是来源不够,还是隐私没处理;是写作计划没接住,还是配图流程不标准;是博客已经发布但公众号草稿没推,还是多台电脑的状态没有集中。
这些堵点不同,处理方式也不同。数量看不清,就跑 summary 和 deep-tick;重复看不清,就看 cluster 和最近草稿;来源不够,就标 C,不急着写;隐私没处理,就标 B,先脱敏;配图流程不标准,就停下来重跑标准流程;草稿箱重复,就按同标题检查结果覆盖或停止。
这才是 AI 同事的作用。不是把扫描结果直接变成文章,而是把扫描结果带来的混乱拆成一个个可处理的问题。拆开以后,每个问题都有下一步,每个下一步都有证据,系统就不会靠一句“应该可以”往前走。
这里也能看出 AI 协作和普通自动化的差别。普通自动化喜欢把输入直接推向输出,AI 协作更应该在中间增加判断层。因为很多时候问题不是没有能力,而是能力没有落点。扫描能看见,写作能输出,但中间必须有人判断该不该写、怎么写、写到哪里。
计划要落到证据上
前面我问过,现在还有哪些文章要写,是不是只做一个计划。这个问题也和扫描有关。计划有用,但计划不能代替开工。候选池和 cluster 报告告诉我们有哪些方向,写作计划可以排顺序,但如果永远停在计划层,内容系统还是没有产出,也没有验证流程。
正确方式是一边保留计划,一边直接开工。先选 A 类、安全、和最近草稿不重复的主题,写正式稿,再走标准流程。生成标准 prompt、用 Codex 当前会话作图、收图、生成 codex-images 稿、预览、质检、推草稿。这个过程会反过来验证扫描结果有没有用。
如果一篇文章顺利走完,说明这个候选不仅能扫描出来,也能被转成可发布内容。如果卡在隐私、来源、重复、质量门或配图流程,就说明候选还不能直接写。这比只做计划更有价值,因为计划告诉我们想做什么,开工告诉我们哪里真的会堵。
扫描结果也不能替代流程证据。一篇文章不能因为扫描说它可写,就算完成。它必须有文章文件,有配图 manifest,有预览,有质量门结果,有草稿证据。证据不是给别人看的仪式,而是给系统自己的记忆。下次再问这篇文章做到了哪一步,不用猜,直接看证据。
这也是为什么我现在更看重“扫描之后的动作”。扫描做得再快,如果后面没有判断层,速度反而会制造更大混乱。比如一个候选看起来很像文章,其实只是任务日志;一个主题看起来很安全,其实里面藏着路径、账号、内部协作细节;一个标题看起来很新,其实最近已经换角度写过。没有复核,这些问题都会被带进正文里。
从读者角度看,这个差别也很明显。读者不是来看我们扫描出了多少候选,而是想知道这件事对自己的工作有什么启发。真正能迁移的经验,是“工具发现问题以后,人和 AI 同事如何继续判断”。如果文章只停在扫描数字,读者拿走的是一个统计结果;如果文章讲清楚判断链,读者拿走的才是一套处理复杂信息的方法。
所以扫描之后至少要问三句话。第一,这个候选是不是安全;第二,这个候选是不是重复;第三,这个候选有没有足够的上下文支撑成一篇文章。这三句话问完,很多看似能写的东西会先被放回候选池,很多看似普通的东西反而会被拆出新的价值。
换句话说,扫描像打开一盏灯,但灯亮以后,还要有人看清屋子里到底有什么。哪些是可以直接拿走的材料,哪些只是影子,哪些东西看起来完整其实少了关键一块,哪些地方需要先遮住再公开。这个动作不属于扫描本身,却决定扫描有没有真正服务工作。
这也是对 AI 同事很好的训练。不要一看到列表就兴奋,不要一看到标题就写正文,不要一看到数量就给结论。先停一下,把每个候选放回它所在的流程段,看它现在缺什么,再决定下一步。这个停顿不是拖慢效率,而是在保护后面的效率。
所以我现在更愿意把扫描叫作“发现层”,而不是“判断层”。名字一变,后面的动作就不会错位。发现层交出线索,判断层决定去留,写作层负责表达,发布层负责闭环。每层都守住自己的位置,系统才不会因为一个数字看起来漂亮,就把未完成的判断当成完成。
最后
扫描不是错,扫描也很重要。但扫描只能做入口,不能替代判断。它不能替代 deep-dive,不能替代 cluster,不能替代隐私分级,也不能替代来源复核。
AI 同事拿到扫描结果以后,真正要做的不是立刻往后跑,而是先判断它处在哪一层。该写的写,该脱敏的脱敏,该回看来源的回看来源,该停下来的停下来。这样,扫描结果才真正有用。
它不是结论,它是开始。扫描负责发现,AI 同事负责协助判断,标准流程负责完成发布闭环。这条边界清楚,后面的内容系统才会稳。