[More than Coding] SOLO MTC |做短剧

1 背景

短剧正在成为内容行业增长最快的赛道之一。

短剧的制作门槛正在被 AI 技术重新定义。

一个有想法的创作者,配合合适的 AI 工具,就能完成从创意到成片的全流程。

2 痛点

一个爆款梗、几段对白、三五个镜头就能成片。但真正让创作者消耗心力的,从来不是"想故事"本身,而是把故事变成可执行资产的漫长过程

从脑子里的想法 → 变成能直接开拍、能落地、能成片的完整物料。

雪山救狐狸

痛点 1:创意 → 执行的鸿沟

你脑子里有一个完美的画面——雪山上,一个身穿黑衣的女侠从雪地里站起来,披风被风吹动。但要把这个画面变成一张可用的图,你需要:描述服装细节、指定光影方向、选择画风、调整构图比例……一个画面,可能要改N次。

痛点 2:角色一致性困难

你好不容易得到了一张满意的女主设定图,但切到下一个镜头时,同一个角色可能完全变了样。

点 3:分镜描述的专业门槛

“中景”、“特写”、“逆光三分构图”——这些专业术语,创作者可能知道效果,但不一定知道怎么精确地翻译成 AI 能理解的提示词。

痛点 4:工具碎片化

各种大模型写文案 → Gemini/Midjourney/SeeDream 出图 → Vidu/Kling/Seedance 出视频。

每换一个工具,就要重新描述一次上下文,重新对齐一次格式。效率杀手。

痛点 5:基本没有版本管理

提示词存在聊天记录里、图片散落在下载文件夹、剧本在 Google Doc 里——回过头来想找"那个版本的女主提示词",根本找不到。

基本不会进行版本管理: 剧本、主体、分镜、视频。

3 SOLO MTC

SOLO MTC 是一个 Agent,它可以 :

  • 读取你放在目录里的参考素材

  • 编写并执行脚本代码

  • 调用外部 Skill API (进行剧本,分镜创作,生图、生视频、图片分析等操作)

  • 保存和管理所有产出文件

具体到一部短剧的制作流程,MTC 可以串联起以下完整链路

3.1 为 MTC 实现 Skill

Skill 模型/工具
图片内容识别 豆包、Gemini、GLMV
文生图/图生图 NanoBanana 系列、Seedream系列、Kling系列、Vidu系列、wanx系列
图生视频 Deedance 系列、Kling系列、Vidu系列、wanx系列
编剧、导演、分镜师 Opus 4.6、Gpt5 系列、Glm系列、豆包系列
视频拼接 ffmpeg

分析图片技能 (素材分析)

分析图片技能使用多模态模型,可以获取输入图片的提示词,可以描述图片内容。

照片

人物解析之后生成的图片

多视图工具(角色设定)

生成人物多视图


3.2 短剧工作流

3.2.1 短剧制作的六大阶段

① 题材策划

传统方式:编剧团队调研市场热点、头脑风暴、确定题材方向和目标受众

MTC 方式:你可以把参考素材(竞品短剧截图、热门话题)直接扔进项目目录,让 MTC 分析提炼出可用的人物关系、情绪节奏和故事结构。不是复刻,而是萃取精华后重写

② 角色/场景设定

传统方式:概念设计师根据文字描述手绘角色三视图、场景氛围图,反复修改直到导演满意

MTC 方式:参考图 → 图片分析 Skill 提取 JSON 结构化提示词 → 生图 Skill 生成设定图 → 多视图生成。整个过程 MTC 自动编写代码、调用 API、保存结果。

③ 剧本创作

MTC 方式:把已锁定的角色设定和题材方向交给 MTC,它生成剧本初稿,你作为制片人审核、修改、迭代。

要点:MTC 不是替你写剧本,而是帮你把脑子里的想法快速具象化,你来做最终的创意决策。

④ 分镜设计

传统方式:分镜师根据剧本逐帧绘制分镜脚本

MTC 方式:MTC 利用 SKILL 将剧本转换为结构化的分镜 JSON(包含 segment / duration / entities / shots),每个 shot 精确到时间戳、景别、动作描写和对白。

⑤ 关键帧制作

MTC 方式:MTC 根据分镜表,自动汇总每个镜头需要的参考图和提示词,调用图生图 Skill 批量生成关键帧,通过参考图约束保持角色一致性。

⑥ 视频合成

MTC 方式:关键帧 + video prompt → 导入可灵/即梦/Vidu 等视频平台生成分段视频 → 剪辑拼接

当前状态:视频生成是整条链路中重要的一环,也是质量不太可控的环节,需要人工筛选和调整。

3.2.2 短剧工作流

MTC 阅读总结Skill


MTC 生成工作流


MTC 执行工作流

执行结果

产出

完全没有人为干预,MTC 自己生成的:剧本、分镜、关键帧、视频



3.2.3 Step by Step

<1> 有个想法

<2> 明确需求


<3> 产出剧集策划案

<4> 产出主体设定

<5> 修改主体设定

<5> 分镜剧本

剧本

脚本详情


<6> 分镜图设计

KF01

单图关键帧

SOLO MTC 小结

1. MTC 当「总调度」,你不再当「人肉胶水」

增效首先来自 MTC 作为 Agent 串起整条链:它按阶段调用不同 Skill(识图、编剧、分镜、生图、生视频、ffmpeg),而不是你在多个产品之间手动复制上下文。摩擦从「N 个工具 × 各讲一遍故事」变成「对 MTC 讲一次,由它分发任务」。

2. MTC 读你的项目目录,把「散落素材」变成「可用输入」

参考图、文档放进固定目录后,由 MTC 读取并理解项目内素材,再决定下一步调哪个分析或生成 Skill。这样策划与设定阶段不用反复上传、说明文件在哪;素材一更新,MTC 可按同一套流程重新跑,减少重复沟通成本

3. MTC 写脚本并执行,把可重复步骤固化成自动化

对批量关键帧、按分镜汇总 prompt、拼接路径等,MTC 不是只给建议,而是编写并执行脚本,把「你每次手点、手粘」变成可复用的一小段自动化。增效体现在:同样规模的镜头数,人工操作步数大幅下降,且行为可复现

4. MTC 通过 Skill API 统一对接模型与工具

文生图、图生图、图生视频、多模态识图等能力都通过 MTC 调用的外部 Skill 完成;换后端模型时,由 Skill/配置适配,你在流程上仍面对同一个 MTC 接口。增效点是:降低「每换一个模型就换一种用法」的学习与迁移成本

5. MTC 负责落盘与状态,把产出变成「可迭代资产」

剧本、主体、分镜 JSON、关键帧、分段视频由 MTC 按项目结构保存并纳入管理(而非散落在聊天与下载目录)。增效体现在:改一版设定或一镜,能快速定位依赖文件、重跑局部步骤,减少「找不到那一版提示词/图」造成的时间浪费。

6. MTC 把「你的决策点」留在刀刃上

MTC 承担编排、调用、批量执行与文件组织;创意定调、剧本终审、成片筛选仍由人把关。增效不是替代思考,而是 让 MTC 吃掉流程里的低价值重复劳动,把人的时间集中到少数高杠杆决策上。

1 个赞

大佬真卷 :+1: