PPT 质量如何被程序化:从「感觉不对」到「规则说了算」
做 jp015 项目的时候,我和 Kimi 有过一段关于 PPT 审稿的协作,让我真正理解了什么叫「把主观审美变成可测规则」。
起点:一份说不清楚哪里不对的 PPT
当时生成了一批 PPT,人工审稿的时候总觉得「哪里不对」,但说不清楚。颜色太花?文字太多?排版太挤?每个人凭感觉说的标准都不一样,A 觉得能用的,B 觉得不行。
更麻烦的是给 Kimi 做自动审稿。最初尝试让 AI 用自然语言描述质量问题,结果每次输出的标准都漂移——有时说「建议减少文字密度」,有时说「排版需要优化」,没有量化,无法比较,也没法自动判断通过还是不通过。
这个卡点本质上是:主观审美无法规模化。一个人凭感觉审 10 份 PPT 可以,审 100 份就疲劳了;让 AI 凭感觉审,感觉本身就不稳定。
关键转折:从描述问题到定义指标
突破点在于把「感觉不对」拆解成具体的、可测量的维度。
我问自己:当我觉得一页 PPT「太挤」的时候,我实际在判断什么?是文字区域占比超过某个阈值。当我觉得「颜色太花」的时候,实际在判断什么?是色相种类超过某个数量。当我觉得「层级不清」的时候,实际在判断什么?是标题字号和正文字号的比值不够大。
把每个主观感受都这样拆下去,最终得到了一组可编程的规则:
- 单页文字密度不超过 40%
- 单页使用色相不超过 3 个(不含黑白灰)
- 标题字号 ≥ 正文字号 × 1.5
- 单行文字不超过 35 字
- 图文间距不低于 12pt
每条规则都有明确的测量方法和阈值,不需要人的主观判断。
Kimi 审稿报告的落地
有了这组规则,Kimi 的审稿就从「给建议」变成了「跑检查」:
输入一份 PPT,逐页逐条跑规则,输出一份结构化的审稿报告——第几页违反了哪条规则,当前值是多少,阈值是多少。不再是「建议优化」,而是「文字密度 52%,超过 40% 阈值」。
这个转变的价值不只是效率。更重要的是它让质量标准变得可讨论、可迭代。有人觉得 40% 的文字密度阈值太严了?好,拿数据来——过去 50 份通过人工审核的 PPT,文字密度中位数是多少?基于数据调阈值,而不是基于争论。
反思
回头看,这次经历最大的收获不是那组具体的规则,而是一个方法:任何反复出现的主观判断,都可以也应该尝试程序化。
程序化不意味着消灭审美,而是把审美中稳定的部分提取成规则,把真正需要人判断的部分留给人的精力。人的精力应该花在「这个风格适不适合这个场景」这种高阶判断上,而不是「这页字是不是太多」这种重复劳动。
jp015 的 PPT 质量门后来成了项目里最稳定的模块之一。不是因为我们写出了多完美的规则,而是因为规则本身是可以迭代、可以量化验证的——这比任何人的感觉都可靠。