【开源】一份超高质量+个性化定制的PPT生成skill:预览->审稿->定稿 多阶段把控

本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社...
【开源】一份超高质量+个性化定制的PPT生成skill:预览->审稿->定稿 多阶段把控
【开源】一份超高质量+个性化定制的PPT生成skill:预览->审稿->定稿 多阶段把控
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:
  • 我的帖子已经打上 开源推广 标签:
  • 我的开源项目完整开源,无未开源部分:
  • 我的开源项目已链接认可 LINUX DO 社区:
  • 我帖子内的项目介绍,AI生成、润色内容部分已截图发出:
  • 以上选择我承诺是永久有效的,接受社区和佬友监督:

以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出

话不多说,直接上图(专门选取了几个不同方向的应用来展示个性化):

image
image
image
image

下面是流程介绍,想直接试效果的佬友可以直接下载试试了: NyxTides/ppt-image-first: PPT image-first skill for Codex CLI

特点:无模板、个性化设计、全流程把控、全程可介入可编辑。

1.项目分析阶段
agent会结合项目和你的需求来进行一些判断和分析,写一份content_report.md,这个阶段没什么好说的,一分钟完事,主要是需求对齐。

2.生成预览
skill会根据你要写的东西和你的选择,分成8个维度去帮你选择最适合的几种风格,生成几套风格合适的PPT预览图,不满意可以提出自己的需求,比如:基于C风格再演化出几版,就会再来一次,直到你满意。

image

3.反演
用户选择喜欢的模板后,skill会根据该风格反演出其中的风格、样式等(因为生图总会带来一些偏差,用户可能喜欢的是生图模型的某些即兴发挥),反演完就会确认用户需求。

image

4.风格确立
这阶段会形成设计风格、风格锁和PPT分页摘要的三份文件,防止风格漂移,并等待用户确认,确认后就进入正式生图。

5.正式生图
可选择每页PPT生成几份候选图。(其实一般一份已经足够强大了,我展示的前两份PPT都是一次抽卡的结果)

6.挑选喜欢序列点击复制(如果上一步生成1份这一步会自动跳过)
选择自己喜欢的点击复制。

image

7.最终审稿
这一步可以直接在界面上进行注释和写画,然后点击复制当前页结果或复制按钮粘贴给agent,可以避免PPT的写者锁,并且可以精细化修改。

image

8.最终成稿
于是就得到一份高质量定制化的PPT。

image
ppt-image-first.pdf (2.2 MB)

核心出装就是gpt image2(当然其他生图模型也行,就是效果应该一般),只要你不嫌弃他是图片型PPT就行,毕竟也以图编辑的方式实现了图片型PPT的可编辑性,可以框选、注释,模型收到后走image2的图编辑接口就可以定点改、局部改(生图和编辑具体方法没在skill中要求,skill中的陈述就是生图和编辑,所以你用其他的生图模型也可以,我的生图实现方法是在本地实现了另一个skill,可以直接并发调用生图和编辑功能,一次性所有图片一起生成,这样生成会很快)

只有free号的佬友也可以通过社区开源的gpt网页生图额度反代项目试试。

NyxTides/ppt-image-first: PPT image-first skill for Codex CLI

3 个帖子 - 3 位参与者

阅读完整话题

来源: linux.do查看原文