【开源自荐】Maliang-deck，基于DSL的可编辑、多动画、多格式AI生成ppt幻灯片工作流

编辑部 2026-05-04T12:17:08.229158 13767 阅读 tech

本帖使用社区开源推广，符合推广要求。我申明并遵循社区要求的以下内容：我的帖子已经打上开源推广标签：是我的开源项目完整开源，无未开源部分：是我的开源项目已链接认可 LINUX DO 社区：是我帖子内的项目介绍，AI生成、润色内容部分已截图发出：是以上选择我承诺是永久有效的，接受社...

【开源自荐】Maliang-deck，基于DSL的可编辑、多动画、多格式AI生成ppt幻灯片工作流

本帖使用社区开源推广，符合推广要求。我申明并遵循社区要求的以下内容：

我的帖子已经打上开源推广标签： 是
我的开源项目完整开源，无未开源部分： 是
我的开源项目已链接认可 LINUX DO 社区： 是
我帖子内的项目介绍，AI生成、润色内容部分已截图发出： 是
以上选择我承诺是永久有效的，接受社区和佬友监督： 是

以下为项目介绍正文内容，AI生成、润色内容已使用截图方式发出

以下内容为纯人工手写，请放心食用。

Intro

Maliang-deck 是一个基于领域特定语言(Demain Specific Language, DSL),面向agent的幻灯片生成工作流。市面上主流的AI-to-slides 工作流大致可以分为以下几种：

面向html。发挥agent的前端能力，通过skill等方式界定workflow。直接让agent生成对应的html文件。优点是生成主题形式自由；但是不方便后续人工修改，同时agent需要花费大量token在对齐元素，输出html标签上。
面向pptx。主要有两个不同的工作流，一个类codex,claude code，直接操控电脑在Office类软件上操作生成内容；另外一个是生成svg(xml)，或者文生图等可视化图片，然后再通过drawingML，或者直接嵌入到pptx里；这类的缺陷同样是对token的消耗大，对模型视觉理解能力要求高。

基于上面的分析，可以看出两种工作流都要求agent消耗大量的token在输出描述图片，网页排版的描述上。这样会带来一个token 效率的问题：随着要生成的幻灯片页数越多，输出的文件上下文越长，agent将耗费大量的token在非内容的叙述上。如果使用一个简单的指标：“token per slide（有效信息）”，不难看出这个指标会是和输出token长度负相关的。

Maliang-deck，则是通过定义一套DSL，把agent从图片生成阶段转移到“编译阶段”：

token cost ∝ HTML / XML / PPTX 复杂度

变成：

token cost ∝ 内容复杂度

Features

Maliang-deck通过把json格式的内容输出当作最终生成来源。能达到下面的优势：

输出token的减少：仅通过DSL工具的调用，用几行命令就能完成把专注内容的json格式转化成复杂的html,pptx,pdf输出；
人工review：不再需要从agent生成的svg，html寻找关键字据再手动修改，您可以从格式化的json里直观看到每页slide对应的内容和文本，轻松实现修改。如果提示词提示AI改某个小地方，那么agent也只需要读取这个json而不用花费大量上下文读取整个html, svg。
多种导出格式的支持：利用DSL作为中间语言，agent可以利用定义好的工具完成从DSL到PPTX, PDF, html的导出。并且由于到PPTX的导出路径是完全基于drawingML(灵感来自ppt-master). 在DSL更新完内容也只需要重新导出就能看出变化。

除此之外，maliang-deck还支持下面优势：

HTML的优势在于丰富的前端动画支持。而现有的html-based slides仅仅是利用agent的前端撰写能力，没有深入发挥前端动画自由度。maliang-deck支持agent自定义css，js动画，而自身也预定义了多个动画控件，涉及文字动画，morphing动画，幻灯片转场等。此外，maling-deck还支持Katex, three.js来生成TeX公式，3D图像可视化和交互。
激光笔模式、白板模式、演讲者模式支持。三个在实际演示用到的工具都默认嵌入在导出的html格式里；
html在线编辑：maliang-deck runtime 里内建简单的编辑模式，支持对元素的文字修改、位置移动、复制删除组件。快速实现slides的refinement.