AI做不好PPT
老婆搞了个新项目,用AI给别人做PPT。
她负责搞流量,然后谈单,交付的事情就落到我头上了,所以我被折磨了两周,这两周内我就一边在搓PPT,一边在打磨工作流,花了两周时间,我做成了一套用AI做PPT的完整流程。
PPT有几种方案,用豆包、Kimi、天工、千问等工具可以直接生成PPT,但可能长这样子。

还有一种方法是用很多人常用HTML,生成之后截图,效果可能是这样子的。

不是不能用,但确实不高级,根本达不到大多数客户的需求。
如果我满意的东西是九十分的话,这些方案大多数只能生成个40分吧。
这也是市面上大多数AI做PPT的教程最大的痛点,能用,但只能自己用,这种类型的PPT,客户是不会买单的。
而经过两周的迭代,这是我用我的工作流跑出来的效果:


下面是我的整个PPT的流程:



不过,今天这篇文章想核心说的并不是PPT,而主要是在这个过程中,关于用AI打造skills工作流的一些经验总结。
因为也许你在做PPT,也许你在做其他项目,做其他流程。
但不可否认的是,随着AI工作AI的能力越发强大,我们几乎所有的业务流都要被彻底地重塑,都要被彻底地改造。在我看来,核心并不是说在工作流上加上AI,而是基于AI的能力,重新把整个流程都进行梳理。

所以下面我会讲的是这两周磨流程过程中悟出来的一些东西——关于怎么把一件事情从人做变成AI做,以及中间那些容易被忽略但极其重要的东西。
一、忘记Skills
这是我这两周最大的领悟。
我一开始也想一步到位——直接让AI写好一个Skill,以后一键生成PPT,多爽。
但现实是,流程都没跑通,就急着封装成Skill,它就是一个盲盒。
我自己一开始就是这样,出了问题不知道哪里错了,改了一个地方又冒出另一个问题。觉得每天很忙,天天在调Skill,但手上永远还是那几个Skill,每次做还是不停地在调。
调了西边,东边错了。东边调了,西边又回来了。
后来我意识到,正确的做法是退回去。
回到没有Skill的时代。
把提示词一段段复制粘贴出来,一步步手工走。第一步满意了,才进第二步。每一步都清楚地知道它在做什么、产出什么、标准是什么。
全部跑通了,才把它封装成Skill。
得先理解这个流程的每一个零件,才有资格把它装进黑盒里。
如果永远在黑盒里做迭代,可能只能从70分拉到75分就顶天了。
要到90分,必须回到手工、看到每一步的真实产出。
二、每次只做一件事
既然要手工跑通,那第一个问题就是:怎么跑?
我的经验是——拆。
拆得越细越好。
核心流程是:
1、先用codex梳理客户的需求
2、利用kimi的agent集群功能进行资料搜集和内容撰写
3、生成每个页面的提示词
4、利用codex的Image generation的插件能力生成每一个页面
5、生成封面页、章节页、目录页
6、正文页面增加标题和logo
7、可选-如果客户需要可编辑的ppt,用工具转换
8、转成可扫描版本的PDF发给客户
我一开始不是这样的。一开始我也是一句话丢给AI:帮我做一份PPT,主题是XX,20页,你自己想办法吧。
结果出来的东西很难看,还不知道问题出在哪。
SOP的意义就是把每个步骤拆出来,每次只做一件事。
拆得越细,哪一步出问题才能追踪。不拆的话,最终产出不满意,根本不知道是文案的问题、风格的问题、还是提示词的问题。
而且拆完之后会发现,很多环节可以同时并行。我可以同时开几个窗口,一个测资料搜集的流程,一个测风格一致性问题,一个测转为可编辑工具的优劣。
各自独立,各自验证。
三、标准先行,不要抽卡
流程拆好了,下一个问题是:每一步做到什么程度算好?
这就需要标准。
比如做PPT之前,我得先回答:什么样的PPT算高级?
客户要的是简洁风、科技感、还是插画风?
每一页的信息密度应该多大?
配色怎么定?
如果客户提供了模板,那么颜色怎么定?
我之前吃的亏就是没想清楚这些。
今天AI灵光一闪,生成了一张还不错的页面。明天灵光不闪,出来的东西风格完全不一样了。
没有标准的SOP,本质上就是抽卡。

每次都在拼运气。
后来我做了一个"视觉风格母版"——把配色体系、字体规范、页面结构、布局锚点、禁止项全部写成一段固定的提示词,每一页生成的时候都完整重复一遍。
这样20页PPT出来,风格才能保持统一。
这就引出另一个问题:标准从哪来?
什么是好的PPT?好的设计应该是什么样的?
我不知道,所以需要ai去搜集资料,然后先把标准定下来。
同时我也会提供一些我觉得好看的PPT模板作为参考物。
我管这个叫方法的方法——做事之前,先搞清楚标准。
标准没搞清楚,AI再强可能也是在错误的路上狂奔。
还有一点体会:标准最好自己写。
AI给你总结一大段"PPT设计规范",看一遍可能全忘了。
但自己动手写下来的东西,哪怕格式很丑,会记在脑子里。下次遇到问题,你知道该去改哪里。
四、并不是非AI不可
有了标准、拆好了步骤,实际做的时候一定会遇到AI做不好的环节。
这时候怎么办?
我的经验是:可以改流程,而不是死磕提示词。
做PPT的时候我遇到一个问题:右上角要固定放客户要求的logo。
前两张还行,第三张第四张logo开始严重变形。
怎么调提示词都解决不了。
最后的解法是什么?
我改了PPT的制作流程,不让AI生成这个东西。
让AI在右上角留出15%的空白位置就好,logo后面用程序批量贴上去。
百分百精准。
同样的,PPT标题容易被AI"画"进图片里。我需要的是可编辑的文字标题,不是画面的一部分。
解法还是一样:先生成无文字的背景图,再用程序叠加文字层。
遇到AI做不好的环节,把它从AI的职责里拿走,用确定性的方式来兜底。
这比花十倍时间调提示词有效得多。
五、质检必须隔离
我踩过一个坑——让AI生成完PPT页面之后,在同一个窗口里让它自己检查质量。
结果它一定会"偷懒"。
同一个对话窗口里,让AI对自己刚生成的PPT页面打分,可能打80分。新开一个窗口、换一个模型去打分,分就没那么高了。
自己给做自己质检,AI基本都会偷懒。

后来我的解法是用API做独立评分。
不在聊天窗口里打分,而是单独拉一个API出来,不带上下文,而且换一个模型。
具体来说,我把做好的PPT页面让codex调用用Gemini模型来做视觉质检。
检查文字有没有被吞掉?
布局有没有跑偏?
配色跟母版一不一致?
是否满足用户的需求?
是否出现文字跑出文字框的情况?
六、给案例,不要给提示词
流程和质检都有了,接下来的问题是:怎么跟AI高效沟通,让它更好地理解我想要什么样的PPT?
以前我觉得提示词要写得越详细越好——风格要求、配色方案、布局规范、禁止项,恨不得写两千字。
而且这个流程如果放在Skills里面,不停的调整、不停的优化,你会发现提示词会越写越长,效果越来越差。
如果你让AI来发现问题、优化,你会发现AI总是陷入一种缺什么补什么。
你说:怎么符号是英文的,它就说好的,然后把所有英文符号都罗列出来,说这些符号不要用英文。
你发现它很笨,它就是发现什么补什么,它总是做不到去提炼出后面的共性。
所以正是基于这一点的发现,我意识到,第一要精简提示词。
第二,再长的提示词不如给几个案例参考。
举个例子,我跟你说,帮我做个PPT,科技感一点、高级一点、简洁一点——你脑袋里其实没什么概念。
但如果我直接甩一份我很满意的成品PPT给你看,你一下就知道了。
AI也是一样的。
做PPT的时候,我先让AI生成三份不同风格的预览图,每份包含8页缩略图。客户从中选一份喜欢的风格,这份就成了后面所有页面的唯一参考标杆。
不是一堆乱七八糟的参考图全部丢给它。那样它抓不住重点,每次生成的风格都不一样。
而且有了参考图之后,提示词反而要写得粗糙一些,不能太细。
太细就把AI的发挥空间锁死了。
每一页的内容不同,需要留给它一些自由去适配。
这个控制的度也很有意思,是一个艺术,到底控制80分好,还是60分好?
需要打磨,需要测试,需要一点“手感”。
但还是第一点和第二点说的,不要skill,要复制粘贴,要一件事情一件事情地做,就能有这个唯手熟尔。
七、80-90分就是极限,别追求完美
沟通效率提上来了,还会遇到一个诱惑:想把每一页都做到完美。
我之前就犯了这个错——试图穷尽AI生成PPT时的各种小问题。
文字渗透进图片里、图标形状不统一、信息密度偏高偏低……
写了一大堆限制规则,发现永远有新问题冒出来。
后来我意识到两件事:
第一,穷尽没有意义。AI在不停进化,今天写下的限制,明天可能就成了新AI的负担。
第二,PPT毕竟是视觉产品,不是程序。不可能做到像素级精密。
追求100%的自动化,这条路一定会碰壁。
用AI做出80-90分就够了,这几乎就是极限。再往上追求,投入产出比会非常低。
同样的道理,做PPT前几份会很痛苦。第一份我折腾了两天,调了100多轮。但到了第三份,可能1天就搞定。到第四份,可能只需要半天时间了,提示词可能都不用怎么改了。
这就是迭代的曲线。
前期投入很大,但一旦流程稳定,效率会指数级提升。
别被前期的痛苦吓退,也别在后期追求完美。
当然还有个原因,就是客户有的时候不需要90分,需要刻意丑化,不然显得不真实……不过,这就是另一层面的话题了。
八、创意的背后,是数学
到这里,可能有人会觉得:PPT毕竟是设计类的工作,设计需要灵感和创意,能这样流程化吗?
但我越做越发现,所有的创意背后其实也是结构——有它的1234步,层层套在里面。
PPT看起来是"设计"。
但如果把主要页面拆开来看,其实发现是可以被总结的。
可以根据需求被总结。
比如这一页是用来写结论的?
展示数据的?
展示对比的?
罗列证据的?
每一个页面,都承载了一个目的,而目的,决定了设计的样式。
这一页是一张配图好?
还是多张配图好?
是需要数据表展示?
还是动画演示?
再结合信息密度的考虑——高密度、中密度、低密度。
最后回顾第二步写好的文字稿,综合起来,就能让每一个页面的设计既达到了目的,也能让所有页面成为一个整体,内容张弛有度。
避免了:连续的页面内容过多;页面内容过少的情况。
结构不是束缚创意,是让创意可复制、可迭代、可交给别人做。
这也是SOP最根本的价值。
而且我发现,当你在一个东西上磨一两周的时候,一定会有一个节点突然顿悟。
这种顿悟,是机械重复做不到的,得沉下心去磨,像个老手艺人一样。

九、真正的护城河——习惯
最后一点,也是我觉得最重要的一点。
以上说的所有方法论——忘记Skills、拆流程、定标准、改流程、做质检、搭建结构——这些都是"术"。
但真正让这些东西发挥作用的,是"习惯"。
以前没人用AI做PPT,你用AI做,做出来的东西比别人漂亮,有优势。
但当所有人都用AI做PPT的时候,优势在哪里?
大家生成的页面都很精美,拉开差距的不是工具,是背后的方法论——怎么拆流程、怎么定标准、怎么做质检、怎么处理AI的短板。
这些东西不是靠工具堆出来的。
是靠习惯养出来的。
我在团队里会要求大家,能用AI做的事情,尽量不要手工做。
不是因为AI一定做得更好,而是因为这是思路的转变。
新工具一开始一定会影响效率,但这恰恰是在培养新的工作习惯。
遇到问题停下来,新开一个窗口去问AI:别人是怎么做的?有没有现成的方案?
因为这是开卷考,答案就在那里。
去折腾、去提问、去调试——也许当下没有直接产出,但能得到最有价值的东西:AI习惯。
这是一个不容易被意识到,但复利极大的东西。
人跟人拉开差距的,可能不是什么知识、技能,就两个字——习惯。
好习惯会驱动我们去往正确的方向。















