1 背景
短剧正在成为内容行业增长最快的赛道之一。
短剧的制作门槛正在被 AI 技术重新定义。
一个有想法的创作者,配合合适的 AI 工具,就能完成从创意到成片的全流程。
2 痛点
一个爆款梗、几段对白、三五个镜头就能成片。但真正让创作者消耗心力的,从来不是"想故事"本身,而是把故事变成可执行资产的漫长过程。
从脑子里的想法 → 变成能直接开拍、能落地、能成片的完整物料。
雪山救狐狸
痛点 1:创意 → 执行的鸿沟
你脑子里有一个完美的画面——雪山上,一个身穿黑衣的女侠从雪地里站起来,披风被风吹动。但要把这个画面变成一张可用的图,你需要:描述服装细节、指定光影方向、选择画风、调整构图比例……一个画面,可能要改N次。
痛点 2:角色一致性困难
你好不容易得到了一张满意的女主设定图,但切到下一个镜头时,同一个角色可能完全变了样。
点 3:分镜描述的专业门槛
“中景”、“特写”、“逆光三分构图”——这些专业术语,创作者可能知道效果,但不一定知道怎么精确地翻译成 AI 能理解的提示词。
痛点 4:工具碎片化
各种大模型写文案 → Gemini/Midjourney/SeeDream 出图 → Vidu/Kling/Seedance 出视频。
每换一个工具,就要重新描述一次上下文,重新对齐一次格式。效率杀手。
痛点 5:基本没有版本管理
提示词存在聊天记录里、图片散落在下载文件夹、剧本在 Google Doc 里——回过头来想找"那个版本的女主提示词",根本找不到。
基本不会进行版本管理: 剧本、主体、分镜、视频。
3 SOLO MTC
SOLO MTC 是一个 Agent,它可以 :
-
读取你放在目录里的参考素材
-
编写并执行脚本代码
-
调用外部 Skill API (进行剧本,分镜创作,生图、生视频、图片分析等操作)
-
保存和管理所有产出文件
具体到一部短剧的制作流程,MTC 可以串联起以下完整链路
3.1 为 MTC 实现 Skill
| Skill | 模型/工具 |
|---|---|
| 图片内容识别 | 豆包、Gemini、GLMV |
| 文生图/图生图 | NanoBanana 系列、Seedream系列、Kling系列、Vidu系列、wanx系列 |
| 图生视频 | Deedance 系列、Kling系列、Vidu系列、wanx系列 |
| 编剧、导演、分镜师 | Opus 4.6、Gpt5 系列、Glm系列、豆包系列 |
| 视频拼接 | ffmpeg |
分析图片技能 (素材分析)
分析图片技能使用多模态模型,可以获取输入图片的提示词,可以描述图片内容。
照片
人物解析之后生成的图片
多视图工具(角色设定)
生成人物多视图
3.2 短剧工作流
3.2.1 短剧制作的六大阶段
① 题材策划
传统方式:编剧团队调研市场热点、头脑风暴、确定题材方向和目标受众
MTC 方式:你可以把参考素材(竞品短剧截图、热门话题)直接扔进项目目录,让 MTC 分析提炼出可用的人物关系、情绪节奏和故事结构。不是复刻,而是萃取精华后重写。
② 角色/场景设定
传统方式:概念设计师根据文字描述手绘角色三视图、场景氛围图,反复修改直到导演满意
MTC 方式:参考图 → 图片分析 Skill 提取 JSON 结构化提示词 → 生图 Skill 生成设定图 → 多视图生成。整个过程 MTC 自动编写代码、调用 API、保存结果。
③ 剧本创作
MTC 方式:把已锁定的角色设定和题材方向交给 MTC,它生成剧本初稿,你作为制片人审核、修改、迭代。
要点:MTC 不是替你写剧本,而是帮你把脑子里的想法快速具象化,你来做最终的创意决策。
④ 分镜设计
传统方式:分镜师根据剧本逐帧绘制分镜脚本
MTC 方式:MTC 利用 SKILL 将剧本转换为结构化的分镜 JSON(包含 segment / duration / entities / shots),每个 shot 精确到时间戳、景别、动作描写和对白。
⑤ 关键帧制作
MTC 方式:MTC 根据分镜表,自动汇总每个镜头需要的参考图和提示词,调用图生图 Skill 批量生成关键帧,通过参考图约束保持角色一致性。
⑥ 视频合成
MTC 方式:关键帧 + video prompt → 导入可灵/即梦/Vidu 等视频平台生成分段视频 → 剪辑拼接
当前状态:视频生成是整条链路中重要的一环,也是质量不太可控的环节,需要人工筛选和调整。
3.2.2 短剧工作流
MTC 阅读总结Skill
MTC 生成工作流
MTC 执行工作流
执行结果
产出
完全没有人为干预,MTC 自己生成的:剧本、分镜、关键帧、视频
3.2.3 Step by Step
<1> 有个想法
<2> 明确需求
<3> 产出剧集策划案
<4> 产出主体设定
<5> 修改主体设定
<5> 分镜剧本
剧本
脚本详情
<6> 分镜图设计
KF01
单图关键帧
SOLO MTC 小结
1. MTC 当「总调度」,你不再当「人肉胶水」
增效首先来自 MTC 作为 Agent 串起整条链:它按阶段调用不同 Skill(识图、编剧、分镜、生图、生视频、ffmpeg),而不是你在多个产品之间手动复制上下文。摩擦从「N 个工具 × 各讲一遍故事」变成「对 MTC 讲一次,由它分发任务」。
2. MTC 读你的项目目录,把「散落素材」变成「可用输入」
参考图、文档放进固定目录后,由 MTC 读取并理解项目内素材,再决定下一步调哪个分析或生成 Skill。这样策划与设定阶段不用反复上传、说明文件在哪;素材一更新,MTC 可按同一套流程重新跑,减少重复沟通成本。
3. MTC 写脚本并执行,把可重复步骤固化成自动化
对批量关键帧、按分镜汇总 prompt、拼接路径等,MTC 不是只给建议,而是编写并执行脚本,把「你每次手点、手粘」变成可复用的一小段自动化。增效体现在:同样规模的镜头数,人工操作步数大幅下降,且行为可复现。
4. MTC 通过 Skill API 统一对接模型与工具
文生图、图生图、图生视频、多模态识图等能力都通过 MTC 调用的外部 Skill 完成;换后端模型时,由 Skill/配置适配,你在流程上仍面对同一个 MTC 接口。增效点是:降低「每换一个模型就换一种用法」的学习与迁移成本。
5. MTC 负责落盘与状态,把产出变成「可迭代资产」
剧本、主体、分镜 JSON、关键帧、分段视频由 MTC 按项目结构保存并纳入管理(而非散落在聊天与下载目录)。增效体现在:改一版设定或一镜,能快速定位依赖文件、重跑局部步骤,减少「找不到那一版提示词/图」造成的时间浪费。
6. MTC 把「你的决策点」留在刀刃上
MTC 承担编排、调用、批量执行与文件组织;创意定调、剧本终审、成片筛选仍由人把关。增效不是替代思考,而是 让 MTC 吃掉流程里的低价值重复劳动,把人的时间集中到少数高杠杆决策上。








































