# ava-ppt-automation Skill 介绍
## 1、Skill简介
这是一个从业务文档、视频、图像和文本素材自动化生成声画同步HTML PPT演示系统的Skill,适合需要制作产品路演、内部培训或学术报告的专业人员使用。
## 2、使用场景
- **为什么想做它?** 需要控制ppt切换节奏、演讲节奏等、演讲表达能力不佳!之前参加一个比赛要求产品介绍必须严格控制在5分钟内!自己讲做不到啊!之前一直让AI使用frontend-slides技能帮忙做ppt,于是在此基础上,既然ppt都是AI做的,那就让AI自己讲吧!连夜让Trae制作了一个自动演讲ppt,然后考虑到有些场景也可能需要这种声色同步的自动化ppt,例如培训等场景,就将其封装成了技能包ava-ppt-automation。ppt宣讲人可以不在,ppt必须继续讲!
- **之前遇到了什么麻烦?** PPT演讲需要精准控制时间!预演排练,确保演示效果符合预期。
- **做出来之后能省掉哪些动作?** 自动完成素材分析、大纲规划、讲稿优化、TTS语音合成、资产管理和自动播放引擎配置;生成可直接播放的声色同步、切换自然的HTML演示文件。
## 3、创作过程
1. **目标设定**:明确要从多媒体素材生成可自动播放、声画同步的演示系统。
2. **资源收集**:研究阿里云百炼TTS API、DashScope图像生成服务以及HTML/CSS动画实现方式。
3. **原型搭建**:描述需求,设计制作流程、让Trae编写实现方案。基础脚本实现从markdown讲稿生成简单HTML幻灯片,集成基本的自动播放逻辑。
4. **迭代优化**:加入素材分析模块(analyze_assets.py)、帧提取工具(extract_frames.py)、多章节音频合成模板以及响应式设计的播放引擎。
5. **测试与反馈**:使用真实产品演示素材验证输出效果,根据测试结果调整时间同步逻辑和视觉预设。
关键提示词示例:
```
请根据`assets/`、`docs/`文件夹中素材和文档,制作一份商业路演ppt
- 演讲时长:5分钟
```
工作流程展示了从素材准备 → 大纲规划 → 资产生成 → 声音合成 → 播放引擎配置 → 最终交付的完整闭环。
## 4、使用步骤
以产品介绍为例,展示如何使用Skill生成声画同步的HTML演示文件:
1. **准备素材**
- 将产品截图、Logo等图片放入`assets/images/`目录
- 将演示录像放入`assets/videos/`目录
- 准备包含演讲内容的markdown文件(参考`demo/presentation.md`)
2. **配置API密钥**
- 在`assets/config.json`中设置阿里云百炼API Key,或导出环境变量`DASHSCOPE_API_KEY`
#### 以下为可选步骤:可以让TRAE自己完成,包括制作SVG动画、调整切换节奏等。
3. **生成图片素材(可选)**
```bash
python scripts/generate_image_template.py
```
编辑`IMAGE_PLAN`定义需要的AI生成图片
4. **生成音频模板(可选)**
```bash
python scripts/generate_audio_template.py
```
编辑`play_plan`定义音频章节和对应幻灯片范围
5. **分析素材时长(可选)**
```bash
python scripts/analyze_assets.py
```
6. **生成最终演示**
- 系统会自动处理素材并生成`index.html`及相关资产
- 直接在浏览器中打开`index.html`即可观看自动播放的演示
- 按空格键手动控制播放/暂停
- 不满意-让Trae自己改!
## 5、效果展示
- **使用前**:需要手动在PowerPoint中制作幻灯片、录制配音、设置动画时间、调整切换节奏,整个过程可能需要数小时。
- **使用后**:准备好素材后,调用技能即可自动生成声画同步的HTML演示,点击右下角的自动播放,ppt就自己开始讲了!演示支持自动播放、精确时间控制、响应式布局,整个制作过程从数小时缩短到不到1小时,包含修改。
## 6、Skill链接
- GitHub仓库:GitHub - sungatetop/ava-ppt-automation · GitHub
- 详细文档:`SKILL.md` 包含完整的工作流说明
- 脚本说明:`scripts/` 目录下的各个Python文件有详细注释
- 演示视频:`demo/demo.mp4` 展示最终效果
- 样式参考:`references/` 目录下的`style_presets.md`和`animation_patterns.md`
## 7、总结与思考
通过此Skill,演示制作效率提升了约80%-90%,特别是对于需要频繁更新内容的场景(如产品迭代路演)。在创作过程中,我深刻体会到将AI能力(TTS、图像生成)与自动化脚本结合,可以显著降低专业内容制作的门槛。
- **目前最满意的地方**:声画同步精度高,能够精确控制每个幻灯片的展示时长、切换节奏、演讲节奏,确保讲解内容与视觉完美匹配。
- **后续优化方向**:加入更多交互元素,让观看者能够与演示进行互动。增加更多场景的ppt模板。
- **希望别人如何体验**:建议先查看`demo/`目录中的示例,然后按照README.md的快速开始步骤运行脚本,最后尝试用自己的素材制作演示并分享使用感受。

