PPT质量如何被程序化：从感觉不对到规则说了算

PPT 质量如何被程序化：从「感觉不对」到「规则说了算」

做 jp015 项目的时候，我和 Kimi 有过一段关于 PPT 审稿的协作，让我真正理解了什么叫「把主观审美变成可测规则」。

当时生成了一批 PPT，人工审稿的时候总觉得「哪里不对」，但说不清楚。颜色太花？文字太多？排版太挤？每个人凭感觉说的标准都不一样，A 觉得能用的，B 觉得不行。

更麻烦的是给 Kimi 做自动审稿。最初尝试让 AI 用自然语言描述质量问题，结果每次输出的标准都漂移——有时说「建议减少文字密度」，有时说「排版需要优化」，没有量化，无法比较，也没法自动判断通过还是不通过。

这个卡点本质上是：主观审美无法规模化。一个人凭感觉审 10 份 PPT 可以，审 100 份就疲劳了；让 AI 凭感觉审，感觉本身就不稳定。

突破点在于把「感觉不对」拆解成具体的、可测量的维度。

我问自己：当我觉得一页 PPT「太挤」的时候，我实际在判断什么？是文字区域占比超过某个阈值。当我觉得「颜色太花」的时候，实际在判断什么？是色相种类超过某个数量。当我觉得「层级不清」的时候，实际在判断什么？是标题字号和正文字号的比值不够大。

把每个主观感受都这样拆下去，最终得到了一组可编程的规则：

每条规则都有明确的测量方法和阈值，不需要人的主观判断。

有了这组规则，Kimi 的审稿就从「给建议」变成了「跑检查」：

输入一份 PPT，逐页逐条跑规则，输出一份结构化的审稿报告——第几页违反了哪条规则，当前值是多少，阈值是多少。不再是「建议优化」，而是「文字密度 52%，超过 40% 阈值」。

这个转变的价值不只是效率。更重要的是它让质量标准变得可讨论、可迭代。有人觉得 40% 的文字密度阈值太严了？好，拿数据来——过去 50 份通过人工审核的 PPT，文字密度中位数是多少？基于数据调阈值，而不是基于争论。

回头看，这次经历最大的收获不是那组具体的规则，而是一个方法：任何反复出现的主观判断，都可以也应该尝试程序化。

程序化不意味着消灭审美，而是把审美中稳定的部分提取成规则，把真正需要人判断的部分留给人的精力。人的精力应该花在「这个风格适不适合这个场景」这种高阶判断上，而不是「这页字是不是太多」这种重复劳动。

jp015 的 PPT 质量门后来成了项目里最稳定的模块之一。不是因为我们写出了多完美的规则，而是因为规则本身是可以迭代、可以量化验证的——这比任何人的感觉都可靠。

起点：一份说不清楚哪里不对的 PPT

这个卡点本质上是：主观审美无法规模化。一个人凭感觉审 10 份 PPT 可以，审 100 份就疲劳了；让 AI 凭感觉审，感觉本身就不稳定。

关键转折：从描述问题到定义指标

突破点在于把「感觉不对」拆解成具体的、可测量的维度。

把每个主观感受都这样拆下去，最终得到了一组可编程的规则：

单页文字密度不超过 40%

单页使用色相不超过 3 个（不含黑白灰）

标题字号 ≥ 正文字号 × 1.5

单行文字不超过 35 字

图文间距不低于 12pt

每条规则都有明确的测量方法和阈值，不需要人的主观判断。

Kimi 审稿报告的落地

有了这组规则，Kimi 的审稿就从「给建议」变成了「跑检查」：

反思

回头看，这次经历最大的收获不是那组具体的规则，而是一个方法：任何反复出现的主观判断，都可以也应该尝试程序化。