1. 项目概述
1.1 目标
根据用户对专业课程的要求和微课视频的制作要求,自动化完成需求拆解、学习者分析、知识体系构建、虚拟教师设定、脚本撰写、素材匹配、音视频合成等流程,输出符合MOOC标准(5-10分钟/个、知识点聚焦、逻辑清晰、适配受众)的系列微课视频,适配不同教学场景与学习者需求。
1.2 背景
在skill模式之前,要实现微课视频的自动化生产需要手搓工作流生产线,传统工作流模式需要对各节点进行配置或开发,遇到改动需要重新设计流程、进行各节点调适,整体流程复用度不高。
利用TRAE SOLO设计微课视频智能编排架构,实现了:
自然语言输入,零配置门槛
AI 自动推断参数,无需手动设置
动态编排执行顺序,智能并行
异常自动处理,无需预设分支
随时中断/恢复,上下文自动保存
2. 实践过程
2.1 任务拆解
(将历史搭建微课视频生产工作流相关的材料给AI作为参考,生成对应的skill)
| 阶段 | 子任务 | 输出物 |
|---|---|---|
| 阶段一:需求解析 | 解析课程大纲、识别目标受众、确定时长风格 | 结构化需求文档 |
| 阶段二:知识构建 | 提取知识点、建立关系图谱、划分微课单元 | 知识图谱JSON |
| 阶段三:脚本生成 | 编写讲解脚本、标注时间轴、设计动画触发点 | 脚本JSON |
| 阶段四:视觉设计 | 选择PPT模板、设计配色方案、制作幻灯片 | PPT文件 |
| 阶段五:视频合成 | 生成配音音频、合成视频、添加字幕 | MP4视频 |
| 阶段六:质量检验 | 内容准确性检验、技术质量检验、MOOC合规检验 | 质量报告 |
2.2 用到的 SOLO 核心能力
| 能力类型 | 具体应用 |
|---|---|
| Skill 调用 | 调用 course-creator 及子技能完成专业任务 |
| 文档处理 | 使用 lark-doc 读取飞书文档作为参考资料 |
| 代码生成 | 使用 pptxgenjs 生成专业PPT |
| 多媒体处理 | 使用 edge-tts 生成语音、ffmpeg 合成视频 |
| 文件管理 | 读写 workspace 和 work 目录管理输入输出 |
| 质量验证 | 使用 validate_layout.py 检验PPT布局 |
2.3 关键 Prompt / 操作过程
2.3.1 需求解析阶段
用户输入:
"请基于《发展心理学》课程内容和课时要求,设计面向心理学专业本科生的系列微课视频"
系统处理:
1. 调用 natural-language-course-parser 解析需求
2. 提取关键信息:
- 课程名称:发展心理学
- 目标受众:心理学专业本科生
- 时长偏好:8-10分钟/节
- 教学风格:案例丰富、理论扎实
2.3.2 知识图谱构建
知识点结构:
┌─────────────────────────────────────────┐
│ 绪论:发展心理学概述 │
├─────────────────────────────────────────┤
│ KN_001 发展心理学的定义(难度:1) │
│ ├── KN_002 研究对象(难度:1) │
│ ├── KN_003 生命全程观(难度:2) │
│ └── KN_004 学科关系(难度:2) │
└─────────────────────────────────────────┘
2.3.3 PPT 生成核心代码
// 配色方案 - 简约手绘风
const COLORS = {
background: 'FFF8E7', // 米白色
primary: 'FF8C42', // 橙色
secondary: '4ECDC4', // 青绿色
text: '2D3436' // 深灰
};
// 创建幻灯片
let slide = pres.addSlide();
slide.background = { color: COLORS.background };
// 添加标题
slide.addText("发展心理学", {
x: 1, y: 1.8, w: 8, h: 1.2,
fontSize: 48, fontFace: "Georgia",
color: COLORS.text, bold: true, align: "center"
});
2.3.4 视频合成流程
# 步骤1:PPT转PDF
libreoffice --headless --convert-to pdf input.pptx
# 步骤2:PDF转图片
pdftoppm -png -r 150 input.pdf slide
# 步骤3:生成音频
edge-tts --text "脚本内容" --voice zh-CN-XiaoxiaoNeural
# 步骤4:合成视频
ffmpeg -f concat -i files.txt -i audio.mp3 output.mp4
2.4 踩过的坑与解决方案
| 问题 | 原因 | 解决方案 |
|---|---|---|
| PPT 布局验证失败 | 文本框重叠 | 调整元素位置和尺寸,确保间距 ≥0.3" |
| 中文引号语法错误 | JavaScript 字符串中的中文引号冲突 | 使用「」或转义符替代 “” |
| moviepy 导入失败 | 版本兼容性问题 | 改用 ffmpeg 直接合成 |
| 幻灯片图片尺寸不一致 | PDF转换分辨率问题 | 统一使用 150 DPI 转换 |
| 音频时长与视频不匹配 | 时间分配计算误差 | 使用权重算法动态分配每页时长 |
3. 成果展示
3.1 第一课成果
| 成果项 | 文件 | 规格 |
|---|---|---|
| 微课视频 | 发展心理学_第一课.mp4 | 1500×844, 25fps, 5分48秒 |
| PPT文稿 | 发展心理学_第一课.pptx | 15页,简约手绘风格 |
| 配音音频 | 发展心理学_第一课_音频.mp3 | 女声,知性沉稳风格 |
| 设计方案 | 微课设计方案_第一课.md | 完整设计文档 |
| 质量报告 | 质量检验报告_第一课.md | 通过全部检验项 |
3.2 视频内容结构
开场导入(45秒)→ 什么是发展心理学(90秒)→ 研究对象与范围(90秒)
→ 研究领域(120秒)→ 学科关系(90秒)→ 总结回顾(45秒)
3.3 视觉设计特点
- 配色:米白背景 + 橙色/青绿色点缀,温馨学术感
- 字体:Georgia 标题 + Calibri 正文,专业易读
- 元素:手绘风格装饰圆形、圆角卡片、时间轴图示
- 动画:关键词高亮、卡片渐显、要点逐条揭示
相关内容详见: https://github.com/LeioHao/mooc-skills
4. 效果与总结
4.1 效果评估
| 维度 | 评分 | 说明 |
|---|---|---|
| 内容质量 | 知识点准确,逻辑清晰 | |
| 视觉设计 | 风格统一,美观专业 | |
| 技术质量 | 音画同步,清晰流畅 | |
| 制作效率 | 全流程自动化,大幅提效 | |
| 可复用性 | 模板化设计,易于批量生产 |
4.2 核心经验总结
4.2.1 成功要素
- 结构化流程:遵循 course-creator 的标准化生产流程,确保每个环节质量可控
- 模板化设计:PPT配色、布局、动画风格统一,保证系列课程视觉一致性
- 自动化工具链:从脚本到视频的端到端自动化,减少人工干预
- 质量门禁:每阶段设置检验点(PPT布局验证、MOOC合规检验)
4.2.2 可复用的 Skill 模式
微课视频生成 Skill 模式:
输入:课程大纲 + 受众描述 + 风格偏好
↓
需求解析 → 知识图谱 → 脚本生成 → PPT制作 → 视频合成 → 质量检验
↓
输出:MP4视频 + PPT + 脚本 + 质量报告
4.2.3 后续优化方向
- 虚拟教师集成:添加数字人形象,增强互动感
- 字幕自动生成:使用语音识别自动生成字幕文件
- 智能动画:基于脚本语义自动匹配动画效果
- 批量生产:支持多节微课并行生成
4.3 价值与意义
本次实践验证了 AI 自动化在微课视频生产中的可行性,形成了一套可复用、可扩展的微课视频生成 Skill 方法论,为教育内容生产的智能化转型提供了实践参考。