非零退出码就重试
这种做法有三个问题
1.浪费时间有些失败是环境临时问题(网络抖动SSH 超时) 重试就能恢复
自动化工作流最怕的不是失败而是不知道为什么失败
这种做法有三个问题
先说清本页判断
补足为什么
留下下一步
失败分类不是为了让日志好看而是为了驱动自动化决策
`failure_retryable()` 函数根据失败类型决定是否值得重试
*) printf 'false'
`failure_next_action()` 函数根据失败类型和当前角色生成人类可读的下一步指导
先说清本页判断
补足为什么
留下下一步
1.所有自动化脚本都应该有失败分类不仅仅是 `stage_with_agents.sh` 任何有重试逻辑的自动化脚本都
先变成材料
再形成结构
最后推动行动
从真实任务开始
把想法变成可处理内容
用结果判断能力
把完成沉淀为流程