【开源自荐】Maliang-deck,基于DSL的可编辑、多动画、多格式AI生成ppt幻灯片工作流

本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社...
【开源自荐】Maliang-deck,基于DSL的可编辑、多动画、多格式AI生成ppt幻灯片工作流
【开源自荐】Maliang-deck,基于DSL的可编辑、多动画、多格式AI生成ppt幻灯片工作流
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:
  • 我的帖子已经打上 开源推广 标签:
  • 我的开源项目完整开源,无未开源部分:
  • 我的开源项目已链接认可 LINUX DO 社区:
  • 我帖子内的项目介绍,AI生成、润色内容部分已截图发出:
  • 以上选择我承诺是永久有效的,接受社区和佬友监督:

以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出


以下内容为纯人工手写,请放心食用。

Intro

Maliang-deck 是一个基于领域特定语言(Demain Specific Language, DSL),面向agent的幻灯片生成工作流。市面上主流的AI-to-slides 工作流大致可以分为以下几种:

  • 面向html。发挥agent的前端能力,通过skill等方式界定workflow。直接让agent生成对应的html文件。优点是生成主题形式自由;但是不方便后续人工修改,同时agent需要花费大量token在对齐元素,输出html标签上。
  • 面向pptx。主要有两个不同的工作流,一个类codex,claude code,直接操控电脑在Office类软件上操作生成内容;另外一个是生成svg(xml),或者文生图等可视化图片,然后再通过drawingML,或者直接嵌入到pptx里;这类的缺陷同样是对token的消耗大,对模型视觉理解能力要求高。

基于上面的分析,可以看出两种工作流都要求agent消耗大量的token在输出描述图片,网页排版的描述上。这样会带来一个token 效率的问题:随着要生成的幻灯片页数越多,输出的文件上下文越长,agent将耗费大量的token在非内容的叙述上。如果使用一个简单的指标:“token per slide(有效信息)”,不难看出这个指标会是和输出token长度负相关的。

Maliang-deck,则是通过定义一套DSL,把agent从图片生成阶段转移到“编译阶段”:

token cost ∝ HTML / XML / PPTX 复杂度

变成:

token cost ∝ 内容复杂度

Features

Maliang-deck通过把json格式的内容输出当作最终生成来源。能达到下面的优势:

  1. 输出token的减少:仅通过DSL工具的调用,用几行命令就能完成把专注内容的json格式转化成复杂的html,pptx,pdf输出;
  2. 人工review:不再需要从agent生成的svg,html寻找关键字据再手动修改,您可以从格式化的json里直观看到每页slide对应的内容和文本,轻松实现修改。如果提示词提示AI改某个小地方,那么agent也只需要读取这个json而不用花费大量上下文读取整个html, svg。
  3. 多种导出格式的支持:利用DSL作为中间语言,agent可以利用定义好的工具完成从DSL到PPTX, PDF, html的导出。并且由于到PPTX的导出路径是完全基于drawingML(灵感来自ppt-master). 在DSL更新完内容也只需要重新导出就能看出变化。

除此之外,maliang-deck还支持下面优势:

  1. HTML的优势在于丰富的前端动画支持。而现有的html-based slides仅仅是利用agent的前端撰写能力,没有深入发挥前端动画自由度。maliang-deck支持agent自定义css,js动画,而自身也预定义了多个动画控件,涉及文字动画,morphing动画,幻灯片转场等。此外,maling-deck还支持Katex, three.js来生成TeX公式,3D图像可视化和交互。
  2. 激光笔模式、白板模式、演讲者模式支持。三个在实际演示用到的工具都默认嵌入在导出的html格式里;
  3. html在线编辑:maliang-deck runtime 里内建简单的编辑模式,支持对元素的文字修改、位置移动、复制删除组件。快速实现slides的refinement.

Repo

具体内容请移步开源仓库:

github.com

GitHub - JeffeyChou/maliang-deck: DSL-first slide production workflow for creating...

DSL-first slide production workflow for creating decks from structured content.

以及演示站点:

jeffeychou.github.io

Maliang Deck Examples

GIF Demo

最后放一些演示动画作为效果展示:

katex-morphing

laser mode

animation

ascii

2 个帖子 - 2 位参与者

阅读完整话题

来源: linux.do查看原文