【Code With SOLO】 短剧创作智能体 CLI | 开源 + 持续更新中

用 TRAE SOLO 从零构建 Multi-Agent 架构

— AI 短剧创作智能体诞生记

1. 摘要

我使用 TRAE SOLO 独立开发了一款基于 Multi-Agent 架构的「AI 短剧创作智能体」。该系统打通了从剧本大纲、角色设定、分镜设计到最终图文/视频生成的全链路闭环,将繁琐的碎片化 AI 创作流程整合成了一键式自动化流水线,极大地降低了 AI 视频内容的创作门槛。

2. 背景

我是茉卷,一名资深开发工程师(火山引擎 ADGL / TRAE EXPERT)。 在当下的 AI 内容创作(尤其是 AI 短剧/视频)领域,创作者通常面临一个巨大的痛点:工具极度碎片化。写剧本用一个大模型,画分镜切到另一个生图工具,最后再去视频模型里逐帧抽卡,整个过程不仅耗费大量时间(制作一个 1 分钟短片往往需要数天),且极难保持角色和场景的连贯性。因此,我希望借助 TRAE 的全新 SOLO 模式,快速构建一个“总控+多专业节点”的自动化创作系统来解决这个提效难题。

整个系统采用 火山引擎 veAdk 智能体框架, 使用火山引擎豆包2.0多模态模型、SeeDream4.5生图模型、SeeDance1.5 视频模型。 更多模型持续更新中~

3. 实践过程

在 TRAE SOLO 的帮助下,我将原本庞大的系统工程拆解并高效落地:

  • 任务拆解与架构设计: 我将复杂的“导演”工作拆解为 6 个专属智能体:Orchestrator(总控调度)、Director(编剧)、Visual Director(视觉导演,负责生成穷尽式分镜 JSON)、Image Gen(生图)、Video Gen(生视频)和 Vision Analyzer(视觉质检)。
  • 利用 SOLO 的核心能力
    • 极速工程脚手架:通过自然语言描述,让 SOLO 快速基于 VeADK 搭建了 Python 项目的底层框架,包括环境变量配置、依赖管理和目录结构。
    • API 深度集成:让 SOLO 帮我无缝接入了豆包/火山方舟大模型(Seed 系列),实现了文本、文生图、图生图、图生视频的跨模态调用。
    • CLI 交互与状态机设计:利用 SOLO 编写了极具极客范儿的终端流式打字机交互界面,并实现了基于 state.json 的本地进度持久化。
  • 踩过的坑与解决方案
    • 上下文爆显存(Token 溢出):多轮长文本对话极易导致 Token 超限。我让 SOLO 帮我设计并实现了一套内置指令(如 /compact 自动总结压缩历史,/clear 清空记忆),完美解决了大模型长文本遗忘和 OOM 的问题。

4. 成果展示

大家可以下载体验(开源项目,持续更新,图片和补充材料我慢慢更新到这个帖子)
只需要火山引擎方舟的 1个 API KEY,就可以体验完整的智能体功能。

需要在火山引擎开通下面的模型:
doubao-seed-2-0-pro-260215
doubao-seedance-1-5-pro-251215
doubao-seedream-4-5-251128

最终产出的 CLI 系统支持通过自然语言一站式完成六大阶段工作流(策划 → 设定 → 剧本 → 分镜 → 关键帧 → 视频)。

以下是智能体底层调用的部分核心多模态能力展示:

(代码仓库开源地址:susirial/purevis_ve_cli)

5. 效果与总结

  • 提效显著:原本需要人工在多个网页端复制粘贴、反复提示词工程的流程,现在只需与总控智能体对话即可。从构思大纲到生成视频片段,整体操作时间缩短了 80% 以上。
  • SOLO 的定位:在这次开发中,TRAE SOLO 扮演了“全栈结对编程专家”的角色。它不仅帮我写出了高质量的 Python 代码,更重要的是承担了繁琐的错误排查、正则匹配和 API 封装工作,让我能将 100% 的精力集中在 Agent 链路编排和业务逻辑上。
  • 可复用的方法论:这套 “总控分发 → 文本生成 → 结构化 JSON 约束 → 多模态生成 → 视觉质检” 的 Multi-Agent 模式具有极强的泛化能力。稍微修改系统提示词,这套代码完全可以平移复用到“AI 漫画生成”、“自动化营销海报制作”等其他业务场景中,是一套极具价值的最佳实践。

--------- SOLO 使用 详情 --------

1 Agent 框架 | 火山引擎 veADK 开发环境初始化

  • 分析火山引擎 Agent开发相关GIT仓库,生成API使用文档(怎么使用,如何调用)

  • 初始化开发环境(python 虚拟环境搭建,安装需要的库)

https://github.com/volcengine/veadk-python/blob/main/veadk_tutorial.ipynb

SOLO 自动初始化环境,安装相关库,生成文档

2 生成 Agent Demo

SOLO 生成测试Demo 代码

3 生成短剧技能工具

使用 Spec 模式,先设计

确认需求后执行

SOLO 生成了可以调用短剧制作工具的智能体

测试生成的工具


4 迭代

4.1 支持 Streaming 输出

4.2 支持 rich 专业的 CLI 交互体验



4.3 设计完整的 短剧智能体

使用 SPEC 模式,输入我们的需求,然后让SOLO 给出设计方案。

第一版结果

审核第一版结果,追加关键问题

多智能体 + 多集系统 + 主体库

多智能体系统


多集系统

1 个赞