【More than Coding】以Skill模式重构微课视频生产线

1. 项目概述

1.1 目标

根据用户对专业课程的要求和微课视频的制作要求,自动化完成需求拆解、学习者分析、知识体系构建、虚拟教师设定、脚本撰写、素材匹配、音视频合成等流程,输出符合MOOC标准(5-10分钟/个、知识点聚焦、逻辑清晰、适配受众)的系列微课视频,适配不同教学场景与学习者需求。

1.2 背景

在skill模式之前,要实现微课视频的自动化生产需要手搓工作流生产线,传统工作流模式需要对各节点进行配置或开发,遇到改动需要重新设计流程、进行各节点调适,整体流程复用度不高。

利用TRAE SOLO设计微课视频智能编排架构,实现了:
:white_check_mark: 自然语言输入,零配置门槛
:white_check_mark: AI 自动推断参数,无需手动设置
:white_check_mark: 动态编排执行顺序,智能并行
:white_check_mark: 异常自动处理,无需预设分支
:white_check_mark: 随时中断/恢复,上下文自动保存


2. 实践过程

2.1 任务拆解

(将历史搭建微课视频生产工作流相关的材料给AI作为参考,生成对应的skill)

阶段 子任务 输出物
阶段一:需求解析 解析课程大纲、识别目标受众、确定时长风格 结构化需求文档
阶段二:知识构建 提取知识点、建立关系图谱、划分微课单元 知识图谱JSON
阶段三:脚本生成 编写讲解脚本、标注时间轴、设计动画触发点 脚本JSON
阶段四:视觉设计 选择PPT模板、设计配色方案、制作幻灯片 PPT文件
阶段五:视频合成 生成配音音频、合成视频、添加字幕 MP4视频
阶段六:质量检验 内容准确性检验、技术质量检验、MOOC合规检验 质量报告

2.2 用到的 SOLO 核心能力

能力类型 具体应用
Skill 调用 调用 course-creator 及子技能完成专业任务
文档处理 使用 lark-doc 读取飞书文档作为参考资料
代码生成 使用 pptxgenjs 生成专业PPT
多媒体处理 使用 edge-tts 生成语音、ffmpeg 合成视频
文件管理 读写 workspace 和 work 目录管理输入输出
质量验证 使用 validate_layout.py 检验PPT布局

2.3 关键 Prompt / 操作过程

2.3.1 需求解析阶段

用户输入:
"请基于《发展心理学》课程内容和课时要求,设计面向心理学专业本科生的系列微课视频"

系统处理:
1. 调用 natural-language-course-parser 解析需求
2. 提取关键信息:
   - 课程名称:发展心理学
   - 目标受众:心理学专业本科生
   - 时长偏好:8-10分钟/节
   - 教学风格:案例丰富、理论扎实

2.3.2 知识图谱构建

知识点结构:
┌─────────────────────────────────────────┐
│ 绪论:发展心理学概述                      │
├─────────────────────────────────────────┤
│ KN_001 发展心理学的定义(难度:1)         │
│   ├── KN_002 研究对象(难度:1)          │
│   ├── KN_003 生命全程观(难度:2)        │
│   └── KN_004 学科关系(难度:2)          │
└─────────────────────────────────────────┘

2.3.3 PPT 生成核心代码

// 配色方案 - 简约手绘风
const COLORS = {
  background: 'FFF8E7',  // 米白色
  primary: 'FF8C42',     // 橙色
  secondary: '4ECDC4',   // 青绿色
  text: '2D3436'         // 深灰
};

// 创建幻灯片
let slide = pres.addSlide();
slide.background = { color: COLORS.background };

// 添加标题
slide.addText("发展心理学", {
  x: 1, y: 1.8, w: 8, h: 1.2,
  fontSize: 48, fontFace: "Georgia",
  color: COLORS.text, bold: true, align: "center"
});

2.3.4 视频合成流程

# 步骤1:PPT转PDF
libreoffice --headless --convert-to pdf input.pptx

# 步骤2:PDF转图片
pdftoppm -png -r 150 input.pdf slide

# 步骤3:生成音频
edge-tts --text "脚本内容" --voice zh-CN-XiaoxiaoNeural

# 步骤4:合成视频
ffmpeg -f concat -i files.txt -i audio.mp3 output.mp4

2.4 踩过的坑与解决方案

问题 原因 解决方案
PPT 布局验证失败 文本框重叠 调整元素位置和尺寸,确保间距 ≥0.3"
中文引号语法错误 JavaScript 字符串中的中文引号冲突 使用「」或转义符替代 “”
moviepy 导入失败 版本兼容性问题 改用 ffmpeg 直接合成
幻灯片图片尺寸不一致 PDF转换分辨率问题 统一使用 150 DPI 转换
音频时长与视频不匹配 时间分配计算误差 使用权重算法动态分配每页时长

3. 成果展示

3.1 第一课成果

成果项 文件 规格
微课视频 发展心理学_第一课.mp4 1500×844, 25fps, 5分48秒
PPT文稿 发展心理学_第一课.pptx 15页,简约手绘风格
配音音频 发展心理学_第一课_音频.mp3 女声,知性沉稳风格
设计方案 微课设计方案_第一课.md 完整设计文档
质量报告 质量检验报告_第一课.md 通过全部检验项

3.2 视频内容结构

开场导入(45秒)→ 什么是发展心理学(90秒)→ 研究对象与范围(90秒)
→ 研究领域(120秒)→ 学科关系(90秒)→ 总结回顾(45秒)

3.3 视觉设计特点

  • 配色:米白背景 + 橙色/青绿色点缀,温馨学术感
  • 字体:Georgia 标题 + Calibri 正文,专业易读
  • 元素:手绘风格装饰圆形、圆角卡片、时间轴图示
  • 动画:关键词高亮、卡片渐显、要点逐条揭示

相关内容详见: https://github.com/LeioHao/mooc-skills


4. 效果与总结

4.1 效果评估

维度 评分 说明
内容质量 :star::star::star::star::star: 知识点准确,逻辑清晰
视觉设计 :star::star::star::star::star: 风格统一,美观专业
技术质量 :star::star::star::star::star: 音画同步,清晰流畅
制作效率 :star::star::star::star::star: 全流程自动化,大幅提效
可复用性 :star::star::star::star::star: 模板化设计,易于批量生产

4.2 核心经验总结

4.2.1 成功要素

  1. 结构化流程:遵循 course-creator 的标准化生产流程,确保每个环节质量可控
  2. 模板化设计:PPT配色、布局、动画风格统一,保证系列课程视觉一致性
  3. 自动化工具链:从脚本到视频的端到端自动化,减少人工干预
  4. 质量门禁:每阶段设置检验点(PPT布局验证、MOOC合规检验)

4.2.2 可复用的 Skill 模式

微课视频生成 Skill 模式:

输入:课程大纲 + 受众描述 + 风格偏好
  ↓
需求解析 → 知识图谱 → 脚本生成 → PPT制作 → 视频合成 → 质量检验
  ↓
输出:MP4视频 + PPT + 脚本 + 质量报告

4.2.3 后续优化方向

  1. 虚拟教师集成:添加数字人形象,增强互动感
  2. 字幕自动生成:使用语音识别自动生成字幕文件
  3. 智能动画:基于脚本语义自动匹配动画效果
  4. 批量生产:支持多节微课并行生成

4.3 价值与意义

本次实践验证了 AI 自动化在微课视频生产中的可行性,形成了一套可复用、可扩展的微课视频生成 Skill 方法论,为教育内容生产的智能化转型提供了实践参考。