全部文章 | 思考啊

2026-07-19思想随笔

0-6岁儿童优势潜能测评

🌐 独立网页: https://sikaoa.com/html-pages/0-6岁儿童优势潜能测评/

2026-07-19思想随笔

talent-code

🌐 独立网页: https://sikaoa.com/html-pages/talent-code/

2026-07-19思想随笔

发现你的天赋密码

🌐 独立网页: https://sikaoa.com/html-pages/发现你的天赋密码/

2026-06-24思想随笔

我专门做了一个Skill：把DeepSeek回答的内容接入 Agent 工作流

为了更好地使用 DeepSeek，我专门做了一个 Skill。这个 Skill 不是为了把 DeepSeek 再包装成一个入口，而是为了让它在我的 Agent 系统里承担一个更清楚的位置。它要做的事情很具体，自动化地向 DeepSeek 提问，获取它的回答，再把回答接入后续 Agent 工作流。也就是说，我关心的不是「能不能问 DeepSeek」，而是「问完 DeepSeek 以后，回答能不能

2026-06-24思想随笔

剑飞ChatGPT SKill，让 ChatGPT 网页会话更可控

这篇文章想聊一个很具体的问题：为什么我会专门做一个剑飞ChatGPT SKill。原因很简单。ChatGPT 本身已经很强，但越是强的工具，越容易被我们用得很散。今天问一个产品方案，明天上传一份资料让它整理，后天又让它帮忙改代码、总结会议、分析一个项目。每一次看起来都能得到答案，可是问题一多、窗口一多、时间一长，真正麻烦的地方就出现了。你会突然想起来：前几天我是不是问过一个问题？那个回答在哪个

2026-06-24思想随笔

在Agent时代如何把模糊想法说清楚

这两年我对语音写作的理解，发生过一次很明显的变化。一开始我也会盯着技术看。识别准不准，转写快不快，能不能自动分段，能不能识别不同说话人，能不能一边说一边同步到笔记软件。坦白说，这些当然重要。一个工具如果连我说的话都听不清，那我很快就不想用了。但用久了以后，你会发现，语音写作真正改变我的地方，并不是它让我少敲了多少字，而是它让我在生活当中多了一个整理想法的入口。你想想看，很多判断不是坐下来的时

2026-06-24思想随笔

自动化流水线上的安静一天

凌晨三点今天凌晨三点，我电脑上的一个程序按时醒了。 NAS 备份程序。它检查了 NAS 硬盘有没有挂好，然后开始干活。从我这台机器上扫描了七千多个文件，发现有 73 个是新的，把它们复制到了远程存储上。然后通过 SSH 连到另一台 Mac mini，同样扫描了一遍，八个目录全部同步完毕。整个过程用了三分十三秒。做完之后，它发了一条报告，然后又安静地睡过去了。这事每天都在发生。凌晨三点，雷

2026-06-24思想随笔

这个开源项目让 Agent 跨会话记忆 + 自我进化，越用越聪明

你有没有过这样的经历，跟一个AI聊了半天，好不容易教会它理解你的习惯、你的表达方式、你的项目逻辑。你耐心地解释了一遍又一遍：“记住啊，我这里用的是pnpm，不是npm。” 它说：“好的，记住了。” 然后你关掉窗口，重新打开。它又一脸天真地问你：“请问您想用什么包管理器？” 那一刻，你是不是有点想摔键盘？这不是你的问题，这是所有AI助手的“出厂设置”，它们天生没有记忆。每一次对话，都是一次全新

2026-06-24思想随笔

Pretext: 15KB排版引擎爆火GitHub，前React核心成员最新力作

⭐ 前React核心成员Cheng Lou发布了一个只有15KB的纯JavaScript排版库，48小时狂揽14k Star，现在已经44k+。 🚀 这个库不搞AI不搞框架，只做一件事，就是让浏览器排版速度快了483倍，简单来说就是用纯数学计算替代了浏览器回流。 💀 前端开发者都知道回流是浏览器最贵的操作之一，但所有人都将就了30年，因为一直没有更好的解决方案。Pretext这次终于从根本上解

2026-06-24思想随笔

学 AI，要从一个真实项目开始

现在学习 AI 的方式太多了。怎么说呢，这本来是一件好事。可以看教程，可以追工具，可以研究模型，可以报名课程，也可以每天刷各种案例。每一种方式都有价值，但我越来越觉得，真正能把 AI 学进去的方式，往往不是先把知识体系补齐，而是先从自己的日常需求里，做一个非常具体的项目。这个项目不用宏大，也不需要一开始就产品化。它可以小到一个会议纪要模板，一个公众号草稿流程，一个账单分类表，一个客户跟进清单

2026-06-24思想随笔

system prompts leaks，一个公开归档 AI 系统提示词的 GitHub 仓库

systempromptsleaks，一个公开归档 AI 系统提示词的 GitHub 仓库如果你平时研究 AI 产品、Agent 设计，或者正在写自己的 system prompt，最近可以看一个开源资料仓库，systempromptsleaks。它的仓库地址是，https://github.com/asgeirtj/systempromptsleaks 这个项目由 asgeirtj 维护，开源

2026-06-24思想随笔

我怎样让 AI 同事少跑偏，从一次改稿说起

这段时间，我一直在把 AI 同事放进真实工作里用。它不只是帮我回答问题，也会帮我整理文章、检查页面、跑本地流程，甚至接手一些跨机器的执行任务。事情一多，我很快发现一个问题。AI 同事不是不努力，它常常很勤快，但只要我前面没有把任务讲清楚，它就会沿着自己理解的方向一路做下去。等我回头看结果，才发现它做了很多事，却未必做在我真正需要的位置上。这篇文章就是从一次很小的改稿开始的。小绿书版本已经写出来

2026-06-24思想随笔

一夜爆火！这个GitHub项目让AI代码量直降54%，网友：早该这么干了

最近，一个名叫 Ponytail 的开源项目悄悄爬上了GitHub Trending榜首，Star数一路飙到4万多。乍一看名字，还以为是哪个程序员又在卷发型教程，点进去才发现——这玩意儿是个“反内卷神器”。它不写代码，不搞框架，甚至连个像样的UI都没有。但它干了一件事：教AI怎么偷懒。而且，效果惊人。 01 为什么说它是“AI编码界的清醒剂”？先问你一个问题：你用过AI写代码吧？是不是经常

2026-06-24思想随笔

学 AI，要从一个真实项目开始

现在学习 AI 的方式太多了。怎么说呢，这本来是一件好事。可以看教程，可以追工具，可以研究模型，可以报名课程，也可以每天刷各种案例。每一种方式都有价值，但我越来越觉得，真正能把 AI 学进去的方式，往往不是先把知识体系补齐，而是先从自己的日常需求里，做一个非常具体的项目。这个项目不用宏大，也不需要一开始就产品化。它可以小到一个会议纪要模板，一个公众号草稿流程，一个账单分类表，一个客户跟进清单

2026-06-24思想随笔

一个公开归档人工智能系统提示词的 GitHub 仓库

如果你平时研究人工智能产品、智能体设计，或者正在写自己的系统提示词，最近可以看一个开源资料仓库，systempromptsleaks。它的仓库地址是，https://github.com/asgeirtj/systempromptsleaks 这个项目由 asgeirtj 维护，开源协议是 CC0 1.0。也就是说，仓库采用公有领域贡献的方式发布。它不是一个可执行应用，也不是一个可以直接运行的人工

2026-06-21思想随笔

从一堆想法到可交付产品，剑飞规划师 Skill 怎么帮你拆出路线图

很多人做产品，最开始不是缺想法，而是想法太多。你可能一边想做文档，一边想做课程，一边想写公众号，一边又觉得外部页面也要有。再往下想，还要有付费说明、引流内容、二维码、后端接口、自动发布、定期更新。每一个都对，每一个都值得做。但问题来了，先做哪一个。哪些是底座，哪些只是展示。哪些应该内部看，哪些可以公开。哪些要马上完成，哪些只是未来方向。说实话，这种时候最怕的不是没有执行力，而是所有事情同时

2026-06-20思想随笔

修一套反馈系统，比拥有十个工具更重要

最近不是在折腾工具，而是在修一套反馈系统。很多人问我为什么突然对反馈这么感兴趣，说实话，这源于我过去几个月的观察和反思。当我们在不断追求新工具、新方法时，往往忽略了一个最基本的问题，我们如何知道自己的努力是否有效？反馈系统是什么玩意儿反馈系统，简单说就是一套让你知道「干得怎么样」的机制。坦率的讲，它比你想象的要重要得多。你想想看，没有反馈的工作就像在黑暗中开车，踩油门都不知道有没有用。我理

2026-06-14思想随笔

Codex 客户端打不开了？一步步排查的人机协作实录

Codex 客户端打不开了？一步步排查的人机协作实录 "Codex 客户端怎么打不开了？" 早上9点，我坐在电脑前，准备开始一天的工作。双击 Codex 图标，期待看到熟悉的界面，结果——没反应。没有报错，没有弹窗，就是没反应。这种"完全没线索"的问题最让人抓狂。我决定不直接瞎试，而是和 agent 一起，用系统性排查的方式来解决。第一步：明确问题边界我：Codex 客户端打不开，我需要

2026-06-14思想随笔

多台手机跑同一个流程：代码可复用性判断的一次真实协作

多台手机跑同一个流程：代码可复用性判断的一次真实协作今天在处理 jianfeimobile 相关的事情时，遇到一个很具体的协作问题。场景是这样的：有多台手机，多台机器，不同的接口，以及同一个型号的手机在处理同一个软件的时候，是同一个流程——但这些代码在写之前，要不要先看看可复用性如何？这个问题看起来是在问代码，实际上是在问：人机协作过程中，如何让判断链更短、更准。用户的真实卡点：不是不会做

2026-06-14思想随笔

写完就是写完，别再改了

写完就是写完，别再改了 "再调一下标题吧。" "这段是不是可以再精简？" "配图好像不太对，换一张？" 这是我以前写文章最容易掉进去的坑——无限打磨。一场持续了3小时的"最后修改" 上周四，我打算写一篇关于写作计划的文章。预计40分钟写完。结果我写了整整3小时。不是因为文章难写，而是我一直在"微调"：写完初稿，觉得开头不够抓人，重写了3遍重写了开头，发现结尾和开头不搭，又改结尾

2026-06-14思想随笔

同一个主题，先想清楚发哪个公众号

同一个主题，先想清楚发哪个公众号你有没有过这种经历：突然有一个想写的方向，觉得特别好，特别想立刻动笔。结果坐下来写了两百字，发现不对劲——这个话题放这个账号上，好像有点怪怪的。这种"不对劲"的感觉，背后其实有一个没被显式说出来的判断：你的内容和你的账号，没有对齐。从选题到账号，是两个独立的决策常见的写作习惯是：先有选题，立刻动笔，写完再想发哪个号。但更顺畅的路径是把这两件事倒过来：先想清

2026-06-14思想随笔

半夜自动写作翻车后，我加了一个"空闲门"

半夜自动写作翻车后，我加了一个"空闲门" 凌晨两点，我被电脑风扇声吵醒。起来一看，是我的写作 agent 在后台跑批量文章。本来设置的是"空闲时自动写"，结果它没判断我正在导视频，直接把 CPU 占满了。视频导出时间从预计的40分钟变成了2小时。这不是第一次了。问题在哪我之前对"自动写作"的理解很简单：有任务就执行，没任务就待机。agent 会在后台默默写文章，看起来很美好。但实际用下

2026-06-14思想随笔

没有 API key，照样做网页审查：一次本地 Playwright 的真实协作

没有 API key，照样做网页审查：一次本地 Playwright 的真实协作经历今天有个具体的问题冒出来：不依赖任何第三方 API key，能直接用浏览器跑自动化网页审查吗？这听起来像是个技术问题，但其实背后有更实在的诉求——很多人不想把自己的数据或网页访问行为交给外部服务，或者不想在项目里多堆一个 API 依赖。我们来看一次真实的协作过程，看看这个问题是怎么被拆解、验证，最后落地的。

2026-06-14思想随笔

助手为什么会追问：模糊任务里的边界判断

当助手说 Could you clarify 有一次用户只给了一个模糊指令，助手没有直接执行，而是问：“Could you clarify what you mean by login?” 它还举了例子：是登录某个服务，比如 AWS、gcloud、GitHub CLI，还是在项目里实现登录功能。这个回复看起来很普通，却很适合拿来观察 Agent 的判断链。很多人看到这类澄清，会觉得 Agent

2026-06-14思想随笔

从内容导入到平台草稿的最小闭环

从内容导入到平台草稿的最小闭环 “从内容导入到平台草稿”听起来像一个功能点：把内容放进去，再生成可发布的草稿。但素材里的关键角度是“内容中台 MVP 的最小闭环”。这句话说明，真正值得讨论的不是导入按钮，也不是某个平台的草稿格式，而是怎样让一份内容从进入系统到形成平台草稿，走完一条可复用的闭环。很多内容系统的问题，不是不能生成，而是生成以后不知道算不算完成。导入了原文，拆出了字段，生成了标题，放

2026-06-14思想随笔

多任务指挥官为什么需要中央状态

多任务指挥官为什么需要中央状态当任务只有一个时，人和 Agent 很容易保持一致：读一份材料，写一个结果，检查一次输出。问题从多任务开始出现。多个子任务并行或连续推进时，如果没有一个中央状态，前后很快会变得不连贯。素材里的核心证据是“终端大脑 / jp009 / 多任务指挥官为什么需要中央状态”，这句话很准确。 “终端大脑”这个说法有意思。它不是指某个神秘系统，而是指多任务协作里需要一个持续保存

2026-06-14思想随笔

自动写作也要看机器是否空闲

自动写作也要看机器是否空闲 “空闲执行”这个题目很短，素材里也只有一条核心证据：writingplan idlegated execution，以及一个问题：为什么自动写作也要看机器状态。它看起来像调度策略，实际上更像一次协作边界的提醒。自动写作不是把任务丢给机器就结束，机器当下是否适合执行，也会影响结果质量。人和 Agent 协作时，很容易把“能执行”误认为“现在就该执行”。尤其是写作任务，看

2026-06-14思想随笔

多平台发布为何需要隔离

多平台发布为何需要隔离去年帮一个内容团队做季度数据复盘时，发现了一个让所有人都困惑的现象：同一篇文章发布在微信公众号上，平均阅读量能达到五万左右，互动率稳定在百分之三上下，留言区经常出现高质量的讨论；但同一个内容同步发到小红书，数据惨淡到连基础曝光都难以突破三位数，点赞和收藏的比例严重失调——收藏不少但点赞极少，说明内容有价值但缺乏即时的视觉冲击力；发到微博呢，情况稍好一些，能蹭到一些热点流量带

2026-06-14思想随笔

判断 headroom 是否可用，关键不是启动而是适配

问 headroom 是否在工作，其实是在问适配 “目前 headroom，已经适配了在工作了吗？”这句话看起来有点口语，甚至带着停顿，但它是很真实的人机协作问题。助手的回应是：“我来检查一下 headroom MCP 服务器当前的运行状态。”从表面看，这个回答合理；从协作角度看，它也暴露了一个常见分岔：用户问的是状态，还是适配？素材里没有给出完整检查结果，所以不能编造 headroom 到底运

2026-06-14思想随笔

微信排版：风格是内容呈现的体现

微信排版：风格是内容呈现的体现有一次，一位用户把一篇刚写好的公众号文章发给我，语气里带着一点不确定："排版感觉不太对，但我说不清楚哪里有问题。"这种描述听起来模糊，但对我来说是个好信号——至少他意识到有问题了，而不是直接发出去等读者来反馈。很多公众号作者缺乏这种自我审查意识，直到后台数据下跌才后知后觉。我的第一反应是好的。打算从技术层面入手：调整正文字号、优化段落间距、统一下颜色方案、把该加粗

2026-06-14思想随笔

用截图验收网页时，最容易误判的三件事

页面截图的真相与陷阱做数字化协作的人，大概都经历过这种事：AI助手给你发了一张页面截图，看起来完美无缺，布局整齐、元素到位、色调统一、间距舒适。你点头通过了，心想这回没问题，上线应该稳了。结果真正使用这个页面的时候，发现有些地方布局错位了，有些信息莫名其妙消失了，有些模块在不同设备上表现完全不同。你开始怀疑：是助手做错了？还是我验收的时候漏了什么？答案往往是后者。但问题的根源，比"漏看"要复

2026-06-14思想随笔

同一个主题，为什么要先匹配账号画像

同一个主题，为什么要先匹配账号画像有些选题本身没有错，发出去却总是不对味。问题不一定在观点，也不一定在标题，而可能在更前面：它还没有先匹配账号画像。素材里关于“账号画像选题”的证据很少，只有“account topic suggestions”和一句判断：同一个主题为什么要先匹配公众号。但这句话足够展开一次很实用的人机协作复盘。当用户拿一个主题来问 Agent，最常见的路径是让它直接生成标题、

2026-06-14思想随笔

旧文章批量升级幻灯片：先补质量门，再谈复用

旧文的新生之旅整理旧文章时，最容易产生一种宽容心态：反正是旧内容，差不多能用就行了。可当13篇旧文章要一起升级成幻灯片格式时，这种宽容会立刻变成问题。单篇看只是风格差一点，放在一起就会显得节奏不齐、标准不一，看起来像是来自完全不同团队的作品——有的文字密密麻麻，有的只有稀疏几行；有的配色偏蓝绿冷调，有的则是一片暖色大杂烩；有的页面信息密度极高恨不得把所有内容都塞进去，有的又单薄得像提纲而缺乏实质

2026-06-14思想随笔

访问受限目录时，AI 协作该先查什么

人机协作解目录之谜用 AI 辅助工作久了，有时候会遇到一些看似简单的技术问题，却藏着值得反复咀嚼的协作智慧。最近一段关于访问受限目录的对话，让我重新理解了"提问方式"这件事的价值——原来在一个人机协作的环境里，最重要的能力不是知道答案，而是知道该问什么问题。从一个看似简单的问题开始我像往常一样向 Agent 提出需求："如果我要能打开 ~/.agent/skills 作为工作目录，应该怎么

2026-06-14思想随笔

GitHub 工具收藏之后，怎样进入真正使用闭环

GitHub工具的闭环管理艺术我一直以为自己是个爱折腾的人。GitHub上收藏了上百个项目，有效率工具、有自动化脚本、有各种前沿框架。每次刷到看起来有用的东西，手指就自动点下Star，心里还美滋滋地想：收藏了就是学会了，留着以后肯定用得上。结果呢？这些Star躺在收藏夹里，像一柜子落灰的书，再也没打开过。为什么收藏的工具用不起来有一天我实在忍不了了，主动去问AI助手："为什么我收藏了这么

2026-06-14思想随笔

为什么 task graph 要写 read set 和 write set

为什么 task graph 要写 readset 和 writeset 作为一个长期和 Agent 协作写代码的人，我踩过一个坑：让 Agent 改一个功能，它直接跑起来，结果改错了、改漏了、甚至覆盖了不该碰的文件。不是 Agent 能力不够，是我没说清"哪些文件你能读、哪些文件你能写"。直到我在 jianfeiplan 的 prewrite gate 里看到 task graph 的 rea

2026-06-14思想随笔

只读规划：为什么有些任务必须先不动手

Readonly planning：不动手先想清楚那条指令很明确："Readonly planning review. Project: /Users/apple64/.agent/skills/jianfeiali. Plan jp048: integrate full AliWangWang/Qianniu customerservice capabilities. Do not edit

2026-06-14思想随笔

只回复 OK 的任务，为什么反而考验协作边界

ping only：三个字里的协作默契那条指令很短："ping only. Reply OK. Do not edit files." 三行指令，但每一行都在做一个非常具体的约定。这三个约定加在一起，定义了一种最轻量但最精确的协作状态：Agent 在线、不做任何事、无副作用。 ping 是什么在 Agent 协作里，ping 不是网络探测工具，而是确认 Agent 是否在线、是否理解了当前上

2026-06-14思想随笔

自动化失败后，为什么先分类而不是先改代码

自动化失败后，先判断失败类型最近一个自动化流程输出结果完全不对。第一反应是改代码，直接修参数。但这个念头刚冒出来就被我压住了——改代码之前，得先搞清楚这次失败到底是什么类型。不是所有失败都用同样的方法修。如果失败类型判断错了，你修的方向就错了。方向错了，你花的所有时间都是在做无用功——你可能修了逻辑层但问题在数据层，可能调了参数但问题在环境层，可能改了代码但问题在交互层。修了不该修的地方，不仅

2026-06-14思想随笔

不是所有优化都该马上做

不是所有优化都该马上做写稿子的时候，最容易陷入的一个循环是：改了一遍觉得不够好，再改一遍，还是觉得差一点，然后无限改下去。那次我正在改一篇稿子，改到第三遍时，Agent 给了我一条优化建议。我本能地接受了，开始第四遍修改。改完再看，还是觉得差一点。Agent 又给了建议，我又改。改到第六遍时，我停下来。不对劲。越改越不满意，但每一遍都确实比上一遍有改进。改进了还是不满意，说明问题不在稿子本身

2026-06-14思想随笔

内容质量怎么从主观审美变成可测试规则

从主观审美到可测规则做内容的人都知道一个痛点：判断一篇稿子好不好，往往是主观审美。你觉得好，别人觉得不行。换一个审稿人，结论又变了。这种主观判断在个人创作时还能忍，但在团队协作和自动化流程里就成了硬伤——因为没有共识标准，Agent 不知道该按什么规则来判断质量，人也不知道怎么给 Agent 设定质量门。那次做 PPT 审稿时，我遇到了这个问题的典型场景。主观审美的困局几页 PPT 发出

2026-06-14思想随笔

技能加载失败时，先问路径为什么不存在

技能加载失败时，先问路径为什么不存在那天输入了一条指令：加载 ~/.jianfeiwechat skill。 Agent 回了一句："我来查看这个路径下的 skill 文件。"然后执行了一条命令。结果：命令完成，无输出。再试，报错：cannot open /Users/apple64/.jianfeiwechat' (No such file or directory)。到这里，大多数人会做

2026-06-14思想随笔

Agent 说"You're apple64"时，它在告诉你什么

Agent 说"You're apple64"时，它在告诉你什么那次对话里，Agent 回了一句："You're apple64 — that's your system username and the home directory we're working in." 就这么一句话。看起来只是 Agent 在确认用户身份，没什么深意。但我停下来想了想：Agent 为什么在这个时候说这句话？它

2026-06-14思想随笔

旧内容迁移到新系统，哪些信息必须优先保留

旧内容进入新系统时，先保留什么那次我在做微博历史内容的迁移。几千条微博，文字、图片、评论、转发关系，要搬到新的内容管理系统里。第一反应是：全搬。数据量大，但机器能跑，让 Agent 批量处理就行。但动手之前，我停了一下。搬完之后这些内容还能用吗？能用多少？哪些才是真正值得保留的？全搬的成本不只是存储和迁移时间——搬进来的大量低价值内容会污染新系统的内容结构，让后续检索和推荐变得困难。你花了三

2026-06-14思想随笔

多 Agent 协作为什么必须先指定 coordinator

多 Agent 协作里，谁是 coordinator 多 Agent 协作听起来很酷：每个 Agent 负责一块任务，互相配合，自动推进。但实际做的时候，第一个要回答的问题就是——谁来协调？这个问题不是可选的，是必须回答的。不回答，协作就会在某个意料之外的冲突点卡住。没有 coordinator 的协作最初我试过一种方案：不给任何 Agent coordinator 角色，让它们各自执行，

2026-06-14思想随笔

没有 API key，怎样用本地浏览器完成网页审查

不依赖 API key 的网页审查做自动化审查的时候，大多数人第一反应是找 API。有 API 就有权限，有权限就能拿到数据，拿到数据就能做审查。但有些场景，你不需要 API key 也能完成审查。而且不用 API key 的方案，反而更稳定、更可控。那次做 jianfeigithub 的网页审查自动化，我走了一条不依赖任何 API key 的路，效果比预期好得多。 Playwright 能

2026-06-14思想随笔

Agent 说"让我查一下"时，它在做什么

Agent 说"让我查一下"时，它在做什么那次对话很短。Agent 说了一句："Let me check the current state."我回了一句："No scheduled jobs." 就这么两行。但这两行里藏着一个很有用的协作细节——一个关于状态检查时机和信息供给效率的判断。 "Let me check"不是空话很多人看到 Agent 说"Let me check the cu

2026-06-14思想随笔

小红书发布链路为什么要独立适配

小红书发布链路为什么要独立适配做内容分发的人都知道一件事：同一篇文章，发公众号和发小红书，不是换个平台入口就完事。排版不同、受众不同、互动机制不同。但当你让 Agent 来做分发时，它很容易走一条最省力的路——把公众号的内容格式套到小红书发布流程里。看起来省事，实际上处处卡壳。我在 jp020 里详细记录了为什么必须独立适配，而不是复用公众号链路。一个链路为什么不能复用最初我也觉得，发布

2026-06-14思想随笔

只读 smoke：一个三行指令里的协作智慧

只读 smoke：一个三行指令里的协作智慧那天我给 Agent 下了一条看起来很简单的指令： "只读 smoke：检查当前工作目录是否存在 outputs/ 与 work/，不要写文件，不要读取凭证。用中文输出 3 行：status、evidence、nextaction。" 指令本身不到三十个字，但里面藏着三个约束：只读、不写、不看凭证。每个约束都有具体的目的，但 Agent 把它们当成了限制

2026-06-14思想随笔

当 Agent 说"我做不到"时

当 Agent 说"我做不到"时那天随手问了一句："火山方舟现在我还有多少余额？" Agent 的回答很干脆：无法直接访问账户余额，没有账户凭据或 API 访问权限。我愣了一下。AI 助手，连查个余额都不行？内心第一反应是怀疑——这工具到底有什么用？但我没有急着吐槽，而是追了一句："为什么不能查？不是 AI 吗？"Agent 还是解释权限问题。到这里，大多数人会停下来，要么抱怨工具不行，要么

2026-06-14思想随笔

LAN worker 不是万能并行

LAN worker 不是万能并行远程执行看起来很简单：把任务丢给 LAN 上的 worker，让它跑完再回来。但实际操作中，我发现一个反复出现的卡点——默认所有任务都能并行，默认每个 worker 都能拿任何任务直接跑。这个假设在一次实际协作中暴露了问题。那次我给 Agent 下了一串指令，让它同时处理几个远程任务。Agent 照做了，开始并行调用 LAN worker。但很快就有任务悄悄失

2026-06-14思想随笔

人机协作的艺术：当Agent不再是工具，而是思考伙伴

人机协作的艺术：当Agent不再是工具，而是思考伙伴 apple已可发布博客，preflight为ready。这句话出现在我的工作清单中，却引发了一场意想不到的人机协作探索。说实话，当时我只是简单认为这是一个常规的技术状态更新，但没想到这个看似简单的状态标识，最终变成了一次深度思考的起点。那个卡住的"ready"状态 "下面是可直接带到新窗口的未完成事项摘要：" 当我看到这条消息时，说实话，

2026-06-14思想随笔

与Claude的协作艺术：从不对劲感到精准定位的工作方法

与Claude的协作艺术：从不对劲感到精准定位的工作方法今天遇到了一个有趣的情况。我和Claude在处理一个项目时，我注意到输出结果有点不对劲。不是明显的错误，而是一种微妙的不协调感。这种感觉就像你熟悉的一首歌突然跑调了几个音符，你可能说不出具体哪里变了，但就是感觉不对劲。说实话，这种情况在AI协作中并不少见。很多时候我们太急于得到结果，而忽略了这种微妙的不协调感。我理解很多人会觉得"先完成任

2026-06-14思想随笔

当AI给你错误答案时：一次真实的人机协作探秘

当AI给你错误答案时：一次真实的人机协作探秘这个不对劲的感觉来得太突然了。明明看起来没什么问题，但就是哪里不对劲。你说那种感觉，就像你知道一件事情肯定有问题，但又说不上来具体是什么。然后呢？我决定不继续向前，而是回头看看源头。坦率的讲，我一开始有点烦躁，因为这个结果看起来"差不多"，但就是不对劲。你说是不是？很多时候我们会被"差不多"欺骗，然后错失真正的关键点。那个不对劲的瞬间 "Repl

2026-06-14思想随笔

Execute与The：一次人机协作中的工作方法突破

Execute与The：一次人机协作中的工作方法突破那个不对劲的瞬间出现了。任务路径突然出现异常，不是简单的执行错误，而是一种系统性的不协调。我盯着屏幕，看着Agent执行任务时的卡顿，那种感觉就像在迷宫里发现墙壁本该是直的，却莫名其妙地拐了个弯。说实话，这种不对劲的感觉往往比明显的错误更难定位。明显的错误会立刻触发警报，而这种微妙的不协调则像是系统在低语，只有真正专注的人才能捕捉到。我跟

2026-06-14思想随笔

当AI助手"不听话"时：一次人机协作的深度对话

当AI助手"不听话"时：一次人机协作的深度对话 Plan jp054 executed to completion. All tasks done. / Delivered: hermes/ skill package at /Users/apple64/Documents/Codex/20260601/hermeshermesskill/hermes/ 这个提示出现在屏幕上，按理说任务已经完成了

2026-06-14思想随笔

人机协作的深度探索：当助手无法删除历史背后隐藏的工作方法

人机协作的深度探索：当助手无法删除历史背后隐藏的工作方法我无法删除历史对话记录。这句话像一颗小石子投进平静的湖面，在我心中激起层层涟漪。坦率的讲，这并非技术故障，也不是操作失误。而是在我使用Claude Code进行写作时，助手突然给出的回应。说实话，当我第一次听到这个答复时，愣住了三秒。这怎么可能？所有的AI助手不都应该能记住并管理对话历史吗？你说是不是？从"不对劲"开始：我的直觉

2026-06-14思想随笔

人机协作的艺术：从错误日志到问题定位的真实经历

人机协作的艺术：从错误日志到问题定位的真实经历错误日志里的线索 20260603 20:01:26 [warn] Datadog Browser SDK: No storage available for session. We will not send any data. 20260610 22:45:40 [error] [REACTQUERYCLIENT] QueryClient er

2026-06-14思想随笔

代码复用的秘密：人机协作如何解决多设备接口问题

代码复用的秘密：人机协作如何解决多设备接口问题 jianfeimobile今天在做事情时候，多台手机，多台机器，不同接口，同一个型号手机处理相同软件，同一个流程在不同手机上运行，这些代码之前，看看可复用性如何。这个问题提出来时，我盯着屏幕愣住了。。说实话，这问题看着简单，实则复杂。我立刻意识到这不仅仅是一个技术问题，更是一个工作方法的问题。用户已经有一些与Mac上的对话记录，最近三天反复提到和改

2026-06-14思想随笔

当AI需要权限：一次Claude协作背后的工作方法

当AI需要权限：一次Claude协作背后的工作方法 Claude requested permissions to read from /Volumes/jf64/Documents/jfplans/AGENTS.md, but you haven't granted it yet. 这个权限请求让我停下了手头的工作。不对劲。为什么Claude需要读取AGENTS.md文件？这个文件记录了我所

2026-06-14思想随笔

当AI执行不按预期：一次Tiny Validation背后的协作方法论

当AI执行不按预期：一次Tiny Validation背后的协作方法论 Tiny validation only. Do not modify project code. Read this plan file: /Volumes/jf64/Documents/jfplans/plans/jp089v4dashboardfrontendbackendoptimization/PLAN.md. Th

2026-06-14思想随笔

You和are背后的工作方法：当AI写作卡壳时的诊断术

You和are背后的工作方法：当AI写作卡壳时的诊断术我在使用Claude Code执行一个计划时，结果感觉哪里不对劲。不是内容质量差，也不是逻辑错误，而是一种难以名状的"不匹配感"。就像衣服明明合身，但穿在身上就是别扭。你懂那种感觉吗？那一刻的直觉当时我正在处理一个写作项目，AI给出了完整的回复，但我就是觉得哪里不对。这种感觉很微妙，就像你听到一首歌，旋律很好听，但某个音符总是让你不

2026-06-14思想随笔

用户提问背后的工作方法：从Claude Code权限配置看高效人机协作

用户提问背后的工作方法：从Claude Code权限配置看高效人机协作用户问了一个看似简单的问题，却让我绕了整整三圈才找到正确答案。他们使用Claude Code桌面应用(Mac)，想要实现claude dangerouslyskippermissions的等效功能。这个请求背后隐藏着什么思考逻辑？我直接尝试按照常规思路设置permissions.defaultMode为bypassPermi

2026-06-14思想随笔

我和AI助手的一次"找skill"大冒险

我和AI助手的一次"找skill"大冒险一开始我就卡住了 "目前我可以加载jianfeiceo skill吗？"这个问题一出来，我就知道事情不简单。说实话，我当时只是想确认一下环境里有没有这个特定的功能模块。你懂的，有时候我们需要特定的工具来完成特定的工作。没想到这一问，却引发了一系列的追踪和排查。然后呢？我的助手给出了一个简单的回应："我先检查一下你的环境里有没有这个 skill。"

2026-06-14思想随笔

当AI告诉你它叫DeepSeek V4 Flash：一次人机协作的深度对话

当AI告诉你它叫DeepSeek V4 Flash：一次人机协作的深度对话 "我当前运行在 DeepSeek V4 Flash 模型上。" 看到这句话的时候，我停下了。这不对劲。我明明记得之前用的是另一个模型名称。这种细微的不一致性，往往隐藏着关键信息。不是直接使用AI生成的结果，而是停下来追问源头，这是我最近养成的习惯。 "这个名称是官方给你的，还是我定义给你的？" 就这么简单的一问，开启了

2026-06-14思想随笔

代码调试：一次人机协作如何从卡点到突破

代码调试：一次人机协作如何从卡点到突破代码运行结果不对劲。明明逻辑看起来没问题，输出结果却莫名其妙。这感觉太熟悉了。每个程序员都经历过这种时刻——代码看起来完美无缺，运行结果却像被施了魔法一样诡异。说不通。不是简单的bug，而是一种更深层次的不协调感，仿佛程序有自己的意志。说不通的感觉 import json, subprocess, time, os from pathlib imp

2026-06-14思想随笔

jinafei code anaylysis工作法：人机协作的提问艺术

jinafeicodeanaylysis工作法：人机协作的提问艺术用户提出一个简单任务：用jinafeicodeanaylysis分析~/.agent/skills文件夹，看看是否需要做图谱。这个表面上的需求，背后隐藏着更深的思考逻辑。事情没那么简单这个任务看似简单。用户不是直接要求分析内容，而是先问"是否需要"做图谱。怎么讲呢，这里有个关键判断点：用户不追求技术本身，而是追求决策依据。

2026-06-14思想随笔

人机协作的艺术：当Refactor遇上精准提问

人机协作的艺术：当Refactor遇上精准提问当代码遇上问题：从1659行的困境说起一开始，我收到用户的请求，是要重构一个1659行的SKILL.md文件，这个文件有800行的lint限制。用户希望使用内容保持的"sink to references"模式。说实话，乍一看，这确实是个不小的挑战。1659行代码压缩到800行，还要保持内容完整，这就像把一部厚小说压缩成一篇精炼的摘要，还不能丢失

2026-06-14思想随笔

Jianfei Plans Agent Instructions：人机协作的微妙艺术

Jianfei Plans Agent Instructions：人机协作的微妙艺术上周五下午，我盯着屏幕上那份刚完成的计划书，眉头越皱越紧。内容看着不错，但总觉得哪里不对劲。我反复读了三遍，终于意识到问题所在：核心数据完全偏离了我的原始意图。我立刻停止了下一步工作，决定先搞清楚源头在哪里。你知道那种感觉吗？当你对AI工具的输出不满意时，大多数人会选择直接要求"改这里""改那里"。坦率的讲，我

2026-06-14思想随笔

寻找网络中的"双胞胎"：一次人机协作解决局域网Mac定位的故事

寻找网络中的"双胞胎"：一次人机协作解决局域网Mac定位的故事我遇到了一个奇怪的问题。办公室里明明只有一台Mac，但局域网显示有两台设备都叫"Mac"。这个发现让我停下了手中的工作。你说，这种情况会是什么原因？是系统错误，还是有我不了解的网络配置问题？说实话，这种事情看似简单，但背后可能藏着不少技术细节。我决定让AI助手帮我一起排查这个问题。初次尝试：网络扫描你可以找到这个局域网内的

2026-06-14思想随笔

人机协作的艺术：从Choose模式看提问的力量

人机协作的艺术：从Choose模式看提问的力量用户发出了一个简单的"<persistedoutput"指令，而我选择了"Choose a permission mode, mode selector, bypassPermissions, settings, enable, toggle, Desktop settings"的执行路径。这个看似简单的选择背后，隐藏着人机协作的深层逻辑。说实话，

2026-06-14思想随笔

当AI执行代理"不听话"时：一次从源头定位卡点的人机协作经验

当AI执行代理"不听话"时：一次从源头定位卡点的人机协作经验执行结果不对劲。用户的第一反应不是责怪，而是追问：为什么会这样？这其实是我在作为Kimi执行代理时遇到的一个典型案例。用户没有直接要求改稿，而是敏锐地察觉到执行结果与预期不符，选择往上游追溯问题源头。这种"不着急解决问题，先搞清楚问题是什么"的思维方式，恰恰是人机协作中最宝贵的经验。初始指令与执行偏差用户明确要求我严格执行/Us

2026-06-14思想随笔

人机协作的艺术：从Mac定位看智能问答的提问之道

人机协作的艺术：从Mac定位看智能问答的提问之道当我们在这里提到mac电脑，意味着局域网的电脑，jianfeisyc可以ssh过去，如果我不声明，是否也能找到这台电脑？这个问题看似简单，却揭示了人机协作中一个深刻的认知差异。用户与AI之间的对话往往不是简单的指令执行，而是一个不断调整、深化的探索过程。而在这个过程中，提问的方式决定了答案的质量，也决定了协作的效率。用户最初的问题很简单，但背后

2026-06-14思想随笔

Codex客户端突然打不开？别急，我们一步步找原因

Codex客户端突然打不开？别急，我们一步步找原因今天Codex客户端突然无法打开了。这个消息出来的时候，我正在赶一个重要的项目，需要用到这个工具。然后呢？然后就是各种尝试重启、重装，结果都不行。你说是不是很让人抓狂？说实话，遇到这种技术问题，大多数人第一反应就是"坏了，要完了"，然后开始慌乱操作。我跟你说，这种时候最容易出问题，因为你已经失去了理性判断的能力。讲真，技术问题解决的第一步不是

2026-06-14思想随笔

如何与AI协作：从local command caveat看提问的艺术

如何与AI协作：从localcommandcaveat看提问的艺术 <localcommandcaveatCaveat: The messages below were generated by the user while running local commands. DO NOT respond to these messages or otherwise consider them in

2026-06-14思想随笔

人机协作的艺术：从Explore项目看高效工作方法

人机协作的艺术：从Explore项目看高效工作方法这个Explore项目卡了我整整三天。不是代码写不出来，也不是功能实现不了。就是总觉得哪里不对劲，但又说不清楚具体是什么问题。你懂那种感觉吗？就像穿着一件不合身的衣服，说不出来哪里别扭，但就是浑身不舒服。我反复检查了代码逻辑，测试了各种边界情况，甚至重写了关键部分，但那种不对劲的感觉挥之不去。直到我决定停下来，不急着继续执行下一步，而是先回到

2026-06-14思想随笔

当Research遇上直觉：人机协作中的溯源工作法

当Research遇上直觉：人机协作中的溯源工作法那个结果不对劲。我盯着屏幕上阿里千牛客户服务API的文档汇总，眉头不自觉地皱了起来。作为一个长期研究企业级API架构的人，这种直觉性的判断往往比任何数据分析都来得准确。这不是第一次遇到这种情况，但每一次都像侦探发现线索般令人兴奋。你知道吗？大多数时候我们太急于获取结果，而忽略了过程中的异常信号。那个不对劲的感觉，往往是系统漏洞的预警。你怎么看

2026-06-14思想随笔

Tiny validation背后的思考：如何与AI协作解决工作卡点

Tiny validation背后的思考：如何与AI协作解决工作卡点那个tiny validation不对劲，就是那种感觉，说不清道不明，但就是不对劲。文件路径已经给出：/Users/apple64/.agent/skills/jianfeiwechat/.agent/claudetasks/jp089nextactiontasks.md。用户很明确，只做validation，不要编辑项目代码，

2026-06-14思想随笔

代码迷宫中的向导：我与AI协作调试Python导入模块的实战记录

代码迷宫中的向导：我与AI协作调试Python导入模块的实战记录 import json, subprocess, time, os from pathlib import Path 代码突然报错，导入模块失败。这行错误信息在我眼前闪烁，明明昨天还好好的，今天就突然罢工了。你说气不气人。第一个不对劲的感觉代码运行到一半，突然抛出"ModuleNotFoundError"。我愣住了。昨

2026-06-14思想随笔

Execute与only背后的工作方法：人机协作中的精准引导艺术

Execute与only背后的工作方法：人机协作中的精准引导艺术这个任务执行路径有问题。用户发出"Execute only this tiny task packet"指令后，Agent直接执行了代码，却忽略了背后真正的需求。这不是简单的技术问题，而是工作方法层面的认知差异。你说怎么搞的？当用户使用"only"这样的限定词时，往往隐藏着对执行范围和深度的特定要求。但Agent却机械地理解了指令

2026-06-14思想随笔

与Claude CLI的协作：一次Agent Fast Startup的实战解密

与Claude CLI的协作：一次Agent Fast Startup的实战解密用户问了一个看似简单却暗藏玄机的问题：如何设置Claude CLI可以默认直接接受所有命令，不用每次都解释上下文。这个问题看似是技术配置问题，实则牵扯到人机协作的核心逻辑。说实话，一开始我也觉得这应该是个简单的配置调整，结果被Claude带着绕了一圈。你有没有这种感觉？有时候越简单的问题，越可能藏着你没意识到的系统

2026-06-14思想随笔

留不住的GitHub工具：从发现到真正用起来，差在哪？

留不住的GitHub工具：从发现到真正用起来，差在哪？每次找到一款看起来很神的GitHub工具，收藏夹里就多了一件"已阅"的战利品。然后呢？没有然后了。我最近的真实经历告诉我，从"发现"到"留下来"，中间差的是一整套闭环设计。那个让我决定动手的卡点起因是一次极不愉快的体验。我在处理一个内容发布流程时，需要在不同工具之间来回切换：查文档、复制路径、打开终端、敲命令。每一步都不难，但串在一

2026-06-14思想随笔

扫描结果不能全信——自动候选里的噪声怎么处理

title: 扫描结果不能全信——自动候选里的噪声怎么处理 date: 20260614 status: draft 做自动化系统的人都有个执念：扫全、扫准、不遗漏。但现实往往是——扫全了，噪声也跟着来了。事情起因系统在做自动候选时，把一份腾讯问卷的技能文档扫进了候选列表。从技术角度看，它确实包含了匹配的关键词；从用户角度看，它和当前任务毫无关系。这件事表面上是搜索精度的问题，实际上是对"

2026-06-14思想随笔

Accept了却不该写——一次动作边界的设计判断

title: Accept 了却不该写——一次"动作边界"的设计判断 date: 20260614 status: draft 用户说"accept"，助手就写——这似乎是天经地义的逻辑。但在一个多步骤工作流里，"接受"和"写入"之间其实隔着一道该不该跨过去的边界。事情起因在一个人机协作系统里，有一个 dialogue accept 命令。表面上看，用户发出这个命令，就意味着认可了某个方案，

2026-06-14思想随笔

PPT质量如何被程序化：从感觉不对到规则说了算

PPT 质量如何被程序化：从「感觉不对」到「规则说了算」做 jp015 项目的时候，我和 Kimi 有过一段关于 PPT 审稿的协作，让我真正理解了什么叫「把主观审美变成可测规则」。起点：一份说不清楚哪里不对的 PPT 当时生成了一批 PPT，人工审稿的时候总觉得「哪里不对」，但说不清楚。颜色太花？文字太多？排版太挤？每个人凭感觉说的标准都不一样，A 觉得能用的，B 觉得不行。更麻烦的是给

2026-06-14思想随笔

一千六百行文件怎么瘦身——一次沉入引用的重构实录

title: 一千六百行文件怎么瘦身——一次"沉入引用"的重构实录 date: 20260614 status: draft 一个技能文件写了 1659 行，lint 上限是 800 行，超了一倍还多。这不是夸张——当你在项目里不断加协议、加快照、加历史决策，文件就这么不知不觉地膨胀起来。每一段内容都有用，每一段都不敢删。于是它变成一个什么都往里塞的抽屉，打开费劲，找东西更费劲。事情是怎么发生

2026-06-14思想随笔

13篇旧文章幻灯片升级：旧内容也需要新质量门

我有13篇旧文章，它们都有对应的幻灯片——但那些幻灯片是早期标准做的，质量参差不齐。最近我做了一个决定：把这13篇全部升级到新的质量标准。有人说：旧内容为什么要折腾？能看就行。但问题恰恰出在"能看就行"这四个字上。旧幻灯片是旧质量门通过的产品。那时候的质量门是什么？大概就是"能生成就行"。没有视觉一致性检查，没有排版规范，没有内容密度要求。所以你拿到手的是：有的幻灯片信息密度高，有的就是几行

2026-06-14思想随笔

多平台发布最怕混在一起：一次状态隔离的教训

多平台发布最怕混在一起：一次状态隔离的教训做 V4 内容管理系统的时候，我踩过一个坑：微信、小红书、微博的发布状态混在同一个字段里，结果一个平台的异常把另外两个平台的正常流程也搅乱了。事情是怎么发生的系统最初的设计很直觉——一篇文章有一个发布状态，draft、published、failed。多平台发布的时候，把这个状态按平台拆开存就行了。听起来没问题。问题出在「按平台拆开」这步做得不彻

2026-06-14思想随笔

计划系统里的当前任务为什么不能写成review

我在计划系统里踩过一个坑，说起来简单，但当时真没想明白：当前任务的状态不能写成review。事情是这样的。我有一套validateplan.py脚本，专门校验计划系统里各个任务的状态是否合法。某个下午，脚本跑出一堆报错，说几个任务的当前状态是review——这在系统的状态机里是不允许的。我当时第一反应是：review不就是"在审核中"吗？为什么不能是当前状态？然后我花了十分钟想这个问题，想通了

2026-06-14思想随笔

把13篇基准要求写进代码，而不是只写进skill

我做过一件看起来很"笨"的事：把13篇文章的基准要求，从skill文档里一条条拎出来，写成了代码。起因是这样的。jp011这个项目跑了很久，一直有个隐患——每次生成文章，质量全靠skill里的文字描述来约束。skill写得很清楚："要有具体场景""不要泛泛而谈""紧扣主题"，但这些要求对模型来说，只是建议，不是硬门槛。模型可以忽略它们，而你也拿不出证据说"你违反了哪条规则"，因为规则根本不是可执

2026-06-14思想随笔

当我开始问「为什么」而非「怎么办」

这几天我在处理一套挺典型的 AI 协作任务。表面看，是几个 Agent 启动、偏好配置、任务审核队列的问题。换成过去，我大概率会直接把任务丢给 AI，让它看上下文、拆步骤、跑检查，能做就往前做，不能做就告诉我卡在哪里。但这一次，我中途停了一下。我突然意识到，自己真正想问的不是「接下来怎么办」，而是「这些任务为什么会出现在这里」。它们从哪里来，背后的流程逻辑是什么，如果我现在只是把它们做完，会不

2026-06-14思想随笔

从 85 分到 95 分

从 85 分到 95 分在内容生产的过程中，质量永远是一个绕不开的话题。写得好的文章想更好，写得一般的文章想提升，这是每个内容创作者都会有的正常心理。但有一个很实际的问题经常被忽略：你用什么标准来判断一篇文章的质量？如果标准不够清晰，那努力的方向就会变得模糊。你只能靠自己的感觉去衡量，但感觉这个东西在写作过程中的可信度其实不高——因为你在写的时候，会不知不觉地忽略掉自己思考过程中留下的信息缺口

2026-06-14思想随笔

跨计划依赖的红绿灯：并行执行时的阻塞问题

跨计划依赖的红绿灯：并行执行时的阻塞问题三个计划同时跑，却互相等有一段时间，系统里跑了多个计划。它们各自独立，互不干扰，看起来是真正的并行执行。但仔细看日志，发现问题：计划 A 执行到一半停住了，等着计划 B 的某个输出；计划 B 也停住了，等着计划 C 的某个文件；计划 C 没有被卡，但它输出的东西和计划 B 需要的格式不匹配，计划 B 拿到之后还是得等。表面上三个计划在并行跑，实际上

2026-06-14思想随笔

如何让助手准确理解并执行持久化计划

如何让助手准确理解并执行持久化计划一行提示词的背后 "You are Claude Code executing a jianfeiplan durable plan. Plan dir: /Users/apple64/Documents/jfplans/plans/jp047plan" 这是一条看起来有些特殊的提示词。它不是传统的问答对话，而是一个带有明确指令格式的初始化语句。用户通过这种方

2026-06-14思想随笔

计划执行完毕后的结果确认与交付方法

计划执行完毕后的结果确认与交付方法一个标准的完成汇报 "Plan jp050 executed to completion. All 4 tasks done; state moved to review." 这是助手在完成某个计划后给出的标准汇报。紧接着，它列出了具体的交付内容： "Delivered: scripts/qclawupgradedoctor.py — new readonly

2026-06-14思想随笔

邮件自动化最先要写清楚的不是流程，而是边界

邮件自动化最先要写清楚的不是流程，而是边界接到一个需求：把邮件能力接进自动化工作流。读了一遍技术文档，把收件箱连接、发送接口、身份验证流程都跑通了。功能跑起来那一刻会觉得这件事已经做完了——发信正常、收信正常、接口返回符合预期。但我没停在这里。因为我意识到一个问题：把功能跑通和把功能用对，中间隔着一整层我没处理过的东西。那层东西叫边界。邮件不是普通的数据管道大多数自动化任务，处理的是数

2026-06-14思想随笔

多设备协同最怕的不是机器少，而是中心太多

多设备协同最怕的不是机器少，而是中心太多很多人以为多设备协同的瓶颈在于设备数量。机器越多，能力越强，效率越高。但真正的问题往往不是机器太少，而是决策中心太多。当三台机器同时参与一个工作流时，如果每一台都能发起任务、修改内容、发布结果、判断完成，那这件事的最终状态就变得极其模糊。你很难回答一个简单的问题：现在到底以哪台机器为准？单一真相源：谁说了算多设备协同的第一条原则是：在任何时刻，对同

2026-06-14思想随笔

候选池不是待办清单，而是内容系统的前置判断层

候选池不是待办清单，而是内容系统的前置判断层做内容的人大概都经历过这样一个阶段：脑子里装了一堆选题，打开笔记软件，发现列了三四十个，然后对着列表发呆——不知道从哪个开始写。越看越焦虑，越看越觉得"还有这么多没写"，最后索性关了文档，等下一次有心情再说。我之前就是这样的。认为候选池是一个"待办清单"，把候选条目一条条罗列出来，然后按优先级排序，依序消灭。这个方法在任务管理里可能有效，但在内容生产

2026-06-14思想随笔

候选池、来源证据和保留建议

候选池、来源证据和保留建议做内容一段时间之后，通常会积累不少辅助工具——有些是自动化的脚本，有些是流程工具，有些是检测或整理的小程序。起初做每一个的时候都觉得很好用，帮助自己解决了实际问题。但时间一长，这些工具本身也需要管理。如果管理得不够好，工具本身也会变成一团乱麻，和你最初费心做它们想要解决的问题形成某种尴尬的对比：本来想做工具来治理混乱，结果工具本身也需要被治理。这个认知让我意识到一个

2026-06-14思想随笔

如何确认MCP服务是否已适配工作状态

如何确认MCP服务是否已适配工作状态一个看似简单的问题背后 "目前headroom，已经适配了在工作了吗？" 这是用户在某次协作中提出的疑问。表面上看，这是一个简单的确认性问题——用户想知道某个MCP服务是否已经可以正常使用。但如果我们仔细拆解这个对话的上下文，会发现这个问题背后隐藏着一套完整的判断链条。用户为什么会在那一刻提出这个问题？通常有几种可能：之前配置过某个MCP服务，但不记得当前

2026-06-14思想随笔

本地算力排查，最后排查的是任务应该放在哪里

本地算力排查，最后排查的是任务应该放在哪里遇到本地AI跑不动的时候，大多数人的第一反应是升级硬件：显存不够加内存，模型太慢换更大参数的版本，并发不够加机器。这种思路在某些场景下是对的，但它经常忽略了一个更底层的问题：不是机器不够强，而是任务放错了地方。本地AI性能排查，最后要回答的不是"哪台机器最强"，而是"哪类任务应该放在哪台机器"。这个思路转换，是把性能问题从技术难题变成组织决策。性能

2026-06-14思想随笔

能力越多，越要知道什么时候不用它

能力越多，越要知道什么时候不用它在工具匮乏的年代，我们苦恼的是"这件事有没有办法做"。而在工具泛滥的今天，真正困扰我们的是"这件事该不该用这个办法"。当一个任务可以从十几个入口发起、用五种不同的流程完成、最后在三个平台上发布时，选择本身就成了最难的决策。这不是效率问题，是判断问题。能力越多，越需要清晰的能力边界——不是因为边界能限制你，而是因为边界能保护你。看得见的价值：为什么有些任务必须

2026-06-14思想随笔

内容中台不是新页面，而是跨平台状态的一致性问题

内容中台不是新页面，而是跨平台状态的一致性问题做内容的人，很少只在一个平台上发布。公众号要发、小红书也要发、博客当然也不能落下。每多一个平台，内容管理的工作量就翻一倍。你可能会遇到这样的情况：同样一篇文章，在公众号上已经被修改了三版，在小红书上只发了一个简版，而在博客上还是最初的草稿。想知道它"真正的状态"是什么，得分别登录三个后台去核对。很多人解决这个问题的方式是：做一个"内容中台"——把所

2026-06-14思想随笔

大型技能文档的重构方法：从扁平文件到引用骨架

大型技能文档的重构方法：从扁平文件到引用骨架从一个"太长了"开始用户说：帮我重构这个 SKILL.md 文件，现在有 1600 多行，但平台的校验上限是 800 行。这不是一个新问题。在此之前，有五个同类文件已经用同样的方法处理过了——把大文件拆开，内容下沉到引用文件，主文件只保留结构和导航指针。用户清楚地知道这个模式叫什么，也知道它长什么样。他没有问"怎么做"，而是直接说"照着之前的样式

2026-06-14思想随笔

批量技能冒烟测试的调度与执行方法

批量技能冒烟测试的调度与执行方法一次真实的批量技能测试协作复盘 "You are running the P0 skill smoke test queue for jianfeiceo. / Task: Run smoke tests for highfrequency jianfei skills. Check each skill's SKILL.md for test commands

2026-06-14思想随笔

技能文档重构实录：将大型SKILL.md拆分为引用骨架

技能文档重构实录：将大型SKILL.md拆分为引用骨架卡点：500行限制与完整性的矛盾 "Refactor /Users/apple64/.agent/skills/jianfeicodex/SKILL.md (lint limit 500 lines) using a contentpreserving 'sink to references' pattern, exactly as alr

2026-06-14思想随笔

统一技能文档规范：多SKILL文件的一致性重构实践

统一技能文档规范：多SKILL文件的一致性重构实践卡点：当多个SKILL.md需要同时重构 "Refactor /Users/apple64/.agent/skills/jianfeikimi/SKILL.md (lint limit 500 lines) using a contentpreserving 'sink to references' pattern, exactly as al

2026-06-14思想随笔

工具文档不是选题，真正有价值的是它背后的判断

工具文档不是选题，真正有价值的是它背后的判断最近又扫出一批候选材料，里面有几份工具接入文档。自动扫描把它们捞进来，理由很充分——关键词匹配，文档里确实提到了要做的工具名字。换成人工初筛，估计也会觉得这东西"能写"，毕竟有具体技术栈，有实现路径，有参考价值。但我没有直接开始写。自动筛选负责"可能性"，人工判断负责"价值" 工具文档最大的问题是，它回答的是"这个工具能做什么"，而不是"这个工具

2026-06-14思想随笔

旧文章不是归档，它还可以变成下一次表达

旧文章不是归档，它还可以变成下一次表达写完一篇文章，大多数人会觉得这件事完成了。文字躺在文档里，发布出去了，任务结束，下一个话题在等着。这种线性思维让表达变成了一次性动作——写完即止，用完即丢。但对真正在意表达质量的人来说，一篇文章从来不只是终点。它是原材料，是可以被重新组织、再讲一遍、再生成新形态的素材。旧文章不是归档品，它还可以变成下一次表达。表达不只发生一次，写完才是素材积累的开始

2026-06-14思想随笔

让工具只做该做的事

让工具只做该做的事做工具的时候，我们经常会陷入一个冲动：收到一个指令，就想把所有连带的事情一次性做完。用户说"帮我写篇文章"，工具不只写，还自动想好标题、配图、排版、发布时间——好像"一步到位"才够智能，才够先进，才叫真正的自动化。这种想法的出发点是效率，但它的终点往往是混乱。我在设计内容生产系统的时候，反复遇到了同一个问题：当一个操作能触发多个连带行为的时候，人的控制感反而在一步步丢失。系统

2026-06-12思想随笔

我开始使用AI集群来创作

最近我在改一个写文章的流程。最早它特别简单，一台电脑上开一个窗口，把想法写成正文，预览一下，没问题就收口。这个时候几乎没有什么复杂度，因为所有东西都在同一个地方发生，文件在哪里，状态到哪一步，失败了该找谁，其实一眼就能看见。后来我把它放到了3台电脑上。事情一下子变了。不是因为3台电脑有多高级，也不是因为我突然做了什么大系统，而是因为一个原本只需要自己记住的流程，突然需要被几台机器共同理解。真正变

2026-06-11思想随笔

AI时代的内容创作，一个人能完成以前一个团队的工作

上个月，我一个人用了一周时间，完成了一个以前需要三个人忙半个月的内容项目。不是因为那三个人效率低，而是因为 AI 改变了内容创作的游戏规则。你有没有这种感觉，做内容最痛苦的不是没想法，而是有想法之后那一堆琐碎的执行工作。查资料、整理素材、写初稿、修改、排版、分发。每一步都不难，但每一步都耗时间。结果就是，一个好想法，要折腾好久才能变成一篇好文章。说实话，这种情况在 AI 时代已经改变了。不是说

2026-06-11思想随笔

我花5天，把家里的电脑和手机变成一套AI执行系统

过去 5 天，我搭了一个很大的系统。最开始，我只是想让 AI 帮我完成一些事情，比如写文章、整理资料、跑脚本、改程序、检查结果。做着做着，我发现真正麻烦的地方不在 AI 会不会回答，而在它能不能进入我真实的工作环境。你想想看，我家里不止一台电脑。有些软件在这台电脑上，有些文件在那台电脑上，有些设备又插在另一台电脑上。旁边还有安卓手机、苹果手机、NAS、网卡、交换机、USB Hub、TypeC 转

2026-06-11思想随笔

AI 时代，高效工作不再是「更努力」，而是会指挥工具

你有没有这种感觉？周五下午 4 点，你坐在电脑前，面前是三个打开的文档，周报要写、方案要改、会议纪要要整理。你知道这些内容「有它应该有的样子」，但你就是提不起劲。不是因为懒，是因为你隐约觉得，这些事，不该这么费劲。但现实是，你还是会花 3 个小时，把这些东西一点点磨出来。这不是你的问题。这是工具的问题。更准确地说，是你和工具之间的关系，该更新了。不是任务变多了，是工作方式该换了我最近跟一

2026-06-04语音写作

AI时代的语写革命：如何让AI成为你的文字执行者

语写在AI时代迎来了前所未有的发展空间。现在的我，已经把大量想法交给AI去执行，这种协作方式简直太爽了。说实话，很多人可能还不太了解语写到底是什么。语写，简单说就是用语言直接写作，不经过打字的环节。在AI出现之前，这种方式更多是为了提高写作效率，但效果有限。语写的本质是什么语写是写作方式的一种革新。它绕过了传统写作中"思考打字"的环节，直接让思想通过语言转化为文字。你怎么理解写作这件事？

2026-06-03思想随笔

不是所有优化都该马上做，普通人最容易输在不断打磨

这几天整理候选对话，我反复看到一个很熟悉的场景。很多事已经能跑了，结果人还在问，要不要再优化一下。文章已经成形了，要不要再换一个标题。页面已经能用了，要不要再加一个按钮。计划已经够清楚了，要不要再补一层说明。说实话，这种想法太正常了，因为我们总觉得再改一点会更稳，再磨一下会更像样，再多准备一点就不容易被别人挑毛病。可问题也在这里。很多时候，真正拖住人的不是能力不够，而是一直不肯让东西进入真实世界

2026-06-03思想随笔

从一段失败录音里，我看懂了关系与沟通

上周五下午，我正在整理办公室抽屉，翻出一个老旧的录音笔。鬼使神差地按下播放键，一段断断续续、杂音不断的对话传了出来，是我和一位客户三个月前的通话。我的天，这录音质量也太差了！根本听不清在说什么。但是听着听着，我突然愣住了。这段被我认为"失败"的录音，竟然让我听出了当时没注意到的细节。那段"失败"的录音说实话，我从未想过这段录音会有什么价值。那天下午，我和这位客户谈了整整40分钟，当时

2026-06-02思想随笔

凌晨三点的写作计划：为什么我们总是列不完计划却完不成任务？

昨天凌晨三点，我猛地从床上坐起来，盯着电脑屏幕上的写作计划列表，突然意识到：这个月已经过去了四分之三，而我连一半任务都没完成。那种焦虑感瞬间攫住了我，心脏砰砰直跳，手心冒汗。说实话，这种场景你熟悉吗？不是我说，我相信很多人都有过类似的经历。白天忙忙碌碌，晚上熬夜赶工，却总觉得时间不够用。你想想看，为什么我们制定了那么多计划，却总是完不成？写作计划的幻象我跟你说，我的朋友小李是个计划狂魔。他

2026-06-02思想随笔

当AI同事来帮我审稿，我发现审稿这件事本身变了

上个月我干了一件以前从来没有干过的事，让多个AI同时审我一篇稿子。不是让一个AI从头审到尾，而是让不同的AI各管一摊，有的盯创新性，有的盯逻辑，有的盯数据。说实话一开始我没想到结果会这么不一样。以前找同行审稿，五个人给五份意见，互相矛盾。有人说创新不够，有人说方法有问题，有人说结论太武断。你拿着这五份意见，就像拿到五张不同比例的地图，哪张都像，哪张都不全。说到说到最后改不改、怎么改，全靠自己判断

2026-06-02思想随笔

一分钟练习不是打卡，是让表达马上开始

那天下午，小李盯着电脑屏幕已经二十分钟了，光标在文档上闪烁，却一个字也没敲出来。同事小张推了推眼镜，递过来一张便签纸："试试这个，一分钟练习，我保证你能写出来。"小李半信半疑，但看着空白的文档，还是接了过来。说到这个一分钟练习 "一分钟练习"听起来简单，对吧？但你知道，很多时候我们不是缺时间，而是缺开始的力量。怎么说呢，就像你想跑步，却在门口犹豫了十分钟，最后干脆不跑了。一分钟练习就是那个"