自动写作机器状态

当你把写作交给机器，最核心的问题不是"写得好不好"，而是"现在到哪一步了"。自动写作系统本质上是一台状态机——选题、起草、审核、排版、发布，每一步都有明确的输入和输出，每一步都可能卡住、回退或分支。如果你不能随时知道这台机器处于什么状态，你就无法信任它的产出。

为什么自动写作需要状态机

手动写作不需要状态机。写作者的大脑就是状态机：选题时在想选题，写的时候在写，改的时候在改，发了就是发了。但自动写作不同。自动写作的每一步都由不同的程序或服务执行，步骤之间有依赖关系，任何一个环节的失败都会影响后续流程。

最常见的痛点是重复发布。候选池里有12篇文章，cron任务每天09:30自动取一篇发布。如果没有精确的状态追踪，同一个选题可能被取两次，导致用户看到"为什么总是这一篇"。这不是推荐算法的问题，是状态机的问题——"已发布"这个状态没有及时写回候选池。

另一个痛点是半成品泄漏。文章写了一半，审核未通过，但因为状态标记不清晰，被当作成品推入了发布队列。轻则内容质量堪忧，重则泄露不应公开的信息。自动写作系统没有人的判断力来兜底，状态的准确性就是质量的最后防线。

还有一个常被忽视的痛点：回退路径缺失。发布后发现有问题需要撤回，但系统只有"发布"操作，没有"撤回"操作。因为设计时只考虑了正常流程，没有考虑异常流程。好的状态机必须定义每个状态的合法转换路径，包括回退。

状态设计的关键维度

自动写作的状态设计需要考虑三个维度：生命周期阶段、发布渠道、审核状态。这三个维度的笛卡尔积构成了完整的状态空间。

生命周期阶段是最基础的维度。一篇文章从诞生到归档，至少经历以下阶段：候选（candidate）→ 起草（drafting）→ 审核（review）→ 排版（formatting）→ 发布（published）→ 归档（archived）。每个阶段都是不可逆的——发布后的文章不会退回起草阶段，除非是特殊修正流程。这种不可逆性简化了状态机，但也意味着错误一旦发生，修正成本很高。

发布渠道是多平台时代的独特维度。同一篇文章可能发布到小红书、微信公众号、博客、微博等不同平台。每个平台的发布状态是独立的：小红书已发布但公众号还在审核中。如果把"发布状态"设计成单一布尔值，就无法表达这种差异。正确的设计是每个渠道独立维护状态：xhs_status、wechat_status、blog_status，各自取值为 pending | published | failed | revoked。

审核状态是质量控制的维度。自动写作不等于无人写作。关键环节需要人工审核：内容审核（是否有敏感信息）、格式审核（排版是否符合平台规范）、策略审核（是否符合发布策略）。审核通过才进入下一阶段，审核不通过则回退到起草阶段并附带修改意见。

状态不一致的典型案例

在多机协作环境中，状态不一致是高发问题。本地机器标记文章为"已发布"，但远程候选池的状态还是"待发布"，下一次cron执行时就会重复取到这篇文章。

根本原因是状态写入不是原子操作。发布成功后需要同时更新本地状态和远程候选池，但网络延迟、服务不可用、进程中断都可能导致只更新了一侧。解决方案是在发布操作中引入两阶段提交：先锁定候选池中的文章状态为"发布中"，发布成功后更新为"已发布"，失败则回退为"待发布"。锁定期间，其他cron任务不会取到这篇文章。

另一个典型问题是状态漂移。长时间运行的cron任务可能在文章状态已经变更后仍在处理旧状态。比如cron A在09:30取到一篇文章开始处理，09:35人工将这篇文章标记为"暂停发布"，但cron A仍在继续执行。解决方案是引入状态检查点：在执行每个关键操作前，重新读取最新状态，如果状态已变更则终止流程。

候选池与状态同步

候选池是自动写作的起点。它本质上是一个状态存储，记录了所有待发布文章及其当前状态。候选池的设计直接影响整个系统的可靠性。

候选池的查询接口需要支持条件筛选：按状态筛选（state=unpublished）、按来源筛选（source=wechat）、按时间筛选（created_after=2026-05-01）。这些筛选条件确保cron任务只取到符合要求的文章，避免误取。

候选池的更新接口需要支持原子更新。更新操作必须包含条件判断：只有当前状态符合预期时才执行更新。比如"将文章A的状态从unpublished改为publishing"，只有当文章A当前确实是unpublished时才成功。如果已经是publishing，说明另一个进程正在处理，本次更新应失败。这种乐观并发控制是防止重复发布的核心机制。

候选池的同步策略需要根据部署架构决定。单机部署时，本地文件或SQLite足够；多机部署时，需要中心化存储（如Redis或数据库）确保状态一致性。关键是不要把状态分散在多个不可同步的位置——每个状态只应该有一个权威来源。

从单机到多机的状态演进

自动写作系统往往从单机开始。一台机器上运行cron任务，本地文件系统存储状态，一切都很简单。但当你需要多账号发布（不同平台不同账号）、多机协作（不同机器负责不同平台）、异地容灾（一台机器挂了另一台接管）时，单机状态模型就不够用了。

多机状态的核心挑战是分布式一致性。不同机器上的cron任务可能同时取到同一篇文章，导致重复发布。解决方案有三种：

第一种是中心化调度。一台机器负责调度，其他机器只执行。调度器维护全局状态，确保同一时间只有一台机器在处理某篇文章。缺点是调度器是单点故障。

第二种是分布式锁。每台机器在处理文章前先获取锁，处理完后释放。Redis的SETNX命令可以实现简单的分布式锁。缺点是需要引入额外的基础设施。

第三种是乐观并发。不使用锁，而是在更新状态时检查条件。如果条件不满足则放弃本次操作。这种方式最简单，但在高并发场景下可能产生较多重试。

实践中，对于自动写作这种低并发场景（每天几十篇文章，几个cron任务），乐观并发就足够了。引入分布式锁或中心化调度是过度工程。

审核与人工介入点

自动写作系统必须有明确的人工介入点。不是每一步都需要人工审核，但关键步骤必须保留"暂停并等待确认"的能力。

内容审核是最重要的介入点。自动生成的文章可能包含事实错误、不当表述或敏感信息。审核可以在两个阶段介入：起草完成后（审核内容质量）、发布前（最终确认）。建议在发布前设置必经审核，即使起草阶段已经审核过。因为排版过程中可能引入新的问题（如截断导致语义变化）。

策略审核是可选的介入点。对于高信任度的内容源（如已验证的公众号文章模板化转换），可以跳过策略审核。对于低信任度的内容源（如全新主题的自动生成文章），策略审核应该强制执行。

异常处理是隐藏的介入点。当自动写作流程遇到异常（网络超时、API报错、内容解析失败），系统应该暂停并通知人工，而不是静默失败后继续。静默失败是自动写作系统最大的隐患——你以为文章没发出去，其实发了；或者你以为发出去了，其实没有。

状态可视化的价值

好的状态机不仅要正确运行，还要让人能看见。状态可视化是调试和运维的基础。

最简单的可视化是状态看板：列出所有文章及其当前状态，支持按状态筛选、按时间排序。当用户反馈"为什么总是这一篇"时，看板应该能在一秒内定位问题——是候选池的状态没有更新，还是cron任务的筛选条件有误。

更进阶的可视化是状态流转图：展示每篇文章从创建到发布的完整流转路径，包括每次状态变更的时间、操作者（人工还是自动）、变更原因。这在排查问题时非常有价值，可以快速定位是哪个环节出了问题。

实时的状态监控也很重要。当cron任务正在执行时，应该能看到"当前正在处理哪篇文章"、"已经执行到哪一步"、"预计还需要多久"。这种透明度不仅方便调试，也能增强用户对自动写作系统的信任。

状态机的实现模式：有限状态机 vs 事件溯源

自动写作系统实现状态管理有两种主流模式，选择取决于系统的规模和复杂度要求。

有限状态机（FSM） 是最直觉的实现方式。定义一组状态、一组合法的状态转换、以及触发转换的事件。每个状态只有有限个后续状态，非法转换直接被拒绝。例如："草稿"状态的合法转换是"→审核中"和"→废弃"，不能直接跳到"已发布"。FSM 的实现简单直接，适合单体系统或状态数量不超过 20 个的场景。Python 的 transitions 库、Go 的 looplab/fsm、JavaScript 的 javascript-state-machine 都能在几小时内搭建起完整的自动写作状态机。

FSM 的局限在于：状态转换逻辑集中在一个模块，当系统需要分布式处理时，状态的一致性保证变得复杂。比如两台机器同时尝试将同一篇文章从"草稿"转换为"审核中"，只有一台应该成功。FSM 本身不解决并发问题，需要外部机制（分布式锁或条件更新）来保证。

事件溯源（Event Sourcing） 是完全不同的思路。不维护当前状态，而是记录所有状态变更事件。当前状态由事件序列回放计算得出。每次状态变更都新增一个事件，事件不可修改、不可删除。这种模式天然提供完整的审计轨迹——每一篇自动写作的文章，其生命周期的每一步变更都有记录。

事件溯源的优势在于：分布式场景下的一致性更容易保证——事件是追加写入的，不存在"覆盖"操作，冲突只在回放时被发现，降低了并发设计的复杂度。自动写作的典型元事件包括：ArticleCreated、DraftCompleted、ReviewPassed、PublishSucceeded、PublishFailed、RolledBack。每个事件携带时间戳、操作者、上下文快照。

事件溯源的代价是：事件存储会持续增长，需要定期快照来控制回放速度；查询当前状态的延迟比直接读状态表高；系统的理解门槛也更高——不是所有团队都适应"用事件序列承载状态"的思维方式。

混合策略在实践中效果最好：用 FSM 管理短流程中的状态转换（起草→审核→发布），用事件溯源记录长流程中的审计历史。FSM 控制流程跳转，事件溯源补充历史查询和故障恢复。自动写作的 cron 任务读 FSM 状态做决策，运维排障查事件溯源日志。

实践建议

状态设计先行。在写代码之前，先画出完整的状态流转图，明确每个状态的含义和合法转换。
单一权威来源。每个状态只在一个地方维护，其他地方通过查询获取。避免状态的多副本导致不一致。
原子更新。状态更新必须是一致的，要么全部成功要么全部回退。使用条件更新确保并发安全。
保留历史。状态变更历史不要删除，它是调试和审计的重要依据。
人工介入点。在关键环节设置暂停点，确保异常时能及时干预。
可视化。让状态可见，问题才可查。没有可视化的状态机是黑箱，出了问题只能猜。