【Skill 创作】用 SOLO 将视觉作品一键重建为 Remotion 可编程视频

用户45269 · 2026 年5 月 12 日 23:53

1、Skill 简介
这是一个自动化视频重建 Skill：给 SOLO 一段 TouchDesigner 数据可视化视频 + 一份内容文档，它能完成"逐帧分析原视频 → 生成 Remotion React 工程 → 用文档内容填充所有面板 → 输出可渲染的 MP4"。适合需要将视觉原型快速转化为可编程视频的创作者、数据可视化工程师和内容制作者。

最终产物是一个包含 5 个 Phase、35+ 个面板、5 种动效文字、带背景音乐和音频的完整 Remotion 工程（1920×1080, 30fps, 900帧/30秒），一键 npx remotion render 即可出片。

2、使用场景
为什么做它？

我有一个 TouchDesigner 做的数据可视化视频（效果很酷但不可复现），手头有一篇《宁夏美食高级综述报告》（18 种美食、12 种风味化合物、跨学科分析），想把这俩东西合在一起——用原视频的视觉语言来讲述报告内容。手工翻做的话需要：

逐帧分析 30 秒视频的每个面板位置、动效参数、切换节奏
手动写 React 组件、调 CSS、对齐 1920×1080 坐标
反复渲染→看效果→微调（每次渲染要等十几分钟）
用 SOLO 之后，整个过程变成"丢视频 + 丢文档 + 说需求"，SOLO 自动完成分析、生成、迭代修复。

能省掉什么？

手工做 SOLO 做
逐帧分析面板位置/动效自动从视频中推断
手写 React 组件和动画自动生成 Phase1-5 完整代码
调试帧范围/重叠 bug 自检修复循环
手填 18 种美食数据从 md 文档自动映射
3、创作过程
第一轮：从视频到工程骨架
输入：上传原视频（grids × Visions by @orkhan）

关键提示词：

Plain Text

1
分析这个视频并生成 Remotion 工程
SOLO 生成了初版工程，但效果跟原视频差异较大——它最初把视频误判为"噪声网格"风格。于是我重新上传视频并选择"改进现有工程"模式。

第二轮：像素级重建
关键提示词（经过多轮迭代后收敛到这段话最有效）：

Plain Text

1
2
3
4
5
6
7
8
9
这是一个典型的 TouchDesigner 数据可视化/艺术数据集解析界面视频：

Phase1: 系统初始化，4-6 个面板从屏幕边缘滑入
Phase2: 节点网络并行展开，面板数量增加到 8-10 个
Phase3: 全面板数据流，硬切图像替换，TSV 极速滚动
Phase4: Blob 对象提取与语义化标签
Phase5: 自然语言描述与收尾减速

风格：工业冷色调、等宽字体、无弹性动效（linear/ease-out）、绝对黑色背景
面板动效：EaseOut 缓出滑入、0.15s stagger、硬切图像切换（无渐变）
这轮之后，工程已经非常接近原视频。

第三轮：内容填充 + 文字动效
上传宁夏美食高级综述报告.md，要求：

Plain Text

1
2
3
4
5
6
7
8
将 md 里的内容填入所有空白的面板里
面板间隙加入数据流动效变化
加入 5 种动效文字：

可微变量字体（font-variation-settings 弹性插值）
滚动驱动揭示（逐字符 ease-out 从下方滑入）
波浪文字（正弦波 + HSL 色彩流动）
弹性脉冲文字（独立字符 spring 弹跳）
数据流文字（水平滚动 Cycle）
第四轮：自检修复循环（最关键的环节）
这是这个 Skill 最特别的能力——SOLO 会自己发现问题并修复。我只需说"自检修复问题"，它就会：

读取全部 Phase 文件逐行审计
输出问题清单（帧越界、面板重叠、空白区域、类型错误）
自动修复 → 编译 → 渲染验证
再来一轮自检
经过 5 轮自检修复，从最初的 25+ 个 BUG 降到 0：

轮次发现问题数主要问题
第1轮 25 个帧越界、类型错误、条件渲染死代码
第2轮 3 BUG + 空白区域 Phase3 面板重叠、Phase1/5 大面积空白
第3轮 5 个 Phase3 新面板与旧面板重复、CSS transition 无效
第4轮 2 个未使用导入、死代码数据导出
第5轮 0 个全绿
改进建议迭代也很有用——我说"你还有哪些修改意见"，SOLO 从视觉质量、动效丰富度、代码架构等角度给了 12 项建议，我选了 11 项执行。

4、使用步骤
前置准备
安装 Remotion：npx create-video@latest
准备一个描述视频布局/动效的说明（或直接上传参考视频）
准备要填充的内容文档
Step 1：丢参考视频 + 描述需求

Plain Text

1
分析这个视频并生成 Remotion 工程
如有 md 文档，一并上传。

Step 2：迭代细化

Plain Text

1
2
修改标准：不规则非对称布局，4-6 个面板大小各异，随时间动态变化
面板动效按照原视频的方式自然运动
Step 3：填充内容 + 加入动效

Plain Text

1
将 md 里的内容填入所有空白面板，加入数据流动效变化和动效文字
Step 4：自检修复（可多次执行）

Plain Text

1
自检修复问题，并对空缺文字的面板补全文字信息，加入动效
Step 5：改进建议 + 执行

Plain Text

1
你还有哪些修改意见
选择要执行的改进项。

Step 6：渲染出片

Plain Text

1
2
cd touchdesigner-grids-remotion
npx remotion render TouchDesignerVisionsWithAudio out/vision.mp4 --codec h264 --crf 18
5、效果展示
最终成果
工程文件：20 个活跃文件（5 Phase + 11 组件 + 2 数据 + Main + Index）
面板总数：35+ 个（分布在 5 个 Phase 中）
动效文字：5 种（VariableFontText / ScrollRevealText / WaveText / PulseText / DataFlowText）
数据流动效：DataFlowParticles（彩色拖尾粒子）、FlowLine（8 点拖尾光线）、ScanLine（扫描线）、AnimatedGrid（脉动背景网格）
内容来源：18 种宁夏美食 + 12 种风味化合物 + 15 条语义描述 + 96 行 Python 代码
背景音频：dialogue.mp3（自动加载）
输出：1920×1080, 30fps, 900 帧（30 秒）, H.264 mp4
5 个 Phase 概览
Phase 时间帧面板数特点
P1 系统初始化 0-4s 0-119 8 REPORT_META 闪现 → 面板逐个滑入
P2 节点网络 4-11s 120-329 8 NodeGraph 脉冲节点 + MosaicWall 576 格
P3 全面板流 11-17s 330-509 9 动态布局变化 + 条件渲染切换
P4 Blob 提取 17-23s 510-689 7 BlobViewer 入场/出场 + 缩略图条
P5 语义解析 23-30s 690-899 8 全屏减速 1→0.05 + 渐暗收尾
视频文件
最新渲染版本 v13：28 MB，全帧无错误

视频外链可通过网盘/视频平台上传后附上。

6、Skill 链接
GitHub / 工程文件：位于工作目录 touchdesigner-grids-remotion/，可打包分享
渲染视频：out/visions_v13.mp4（28 MB）
7、总结与思考
最满意的地方
自检修复循环是这个 Skill 最大的亮点。传统视频制作中，“面板重叠了 5px”"这段文字在 3 秒后会被截断"这类问题需要反复渲染后肉眼检查，而 SOLO 可以逐行审计代码、计算坐标、预测帧行为，比人工检查快一个数量级。

效率提升
对比维度手工 SOLO
原视频逐帧分析 30-60 分钟 3-5 分钟
工程代码编写 4-8 小时 10-15 分钟
调试修复（5 轮） 2-4 小时每轮 2-5 分钟
总计约 1-2 天约 40 分钟
后续优化方向
把从视频到工程的过程进一步自动化（视频帧提取 → OCR/布局检测 → 骨架代码）
加入更多组件模板（雷达图、热力图、3D 场景），让数据可视化面板更丰富
MosaicWall（576 张图片同时渲染）是性能瓶颈，需要改为 canvas 绘制
希望得到的反馈

是否还有其他视频类型（VJ 素材、信息图表、产品 Demo）可以走同样的"分析→重建→填充内容"流程？
Phase 交替时的过渡效果还有什么更自然的做法？
用 SOLO 创作，总共对话约 30 轮交互，从空白工程到渲染出片。