【学习工作赛道】DramaFlow AI —— AI 短剧自动生成工作流平台

LayJustDoIt · 2026 年6 月 20 日 12:23

【标题】
【学习工作赛道】做一个 AI 短剧自动生成工作流平台

【标签】
学习工作

【正文】

1. 创意名称 + 创意介绍

创意名称：DramaFlow AI —— AI 短剧自动生成工作流平台

我想做的是一个面向短视频内容创作者、运营人员和个人开发者的 AI 短剧生产工具。它不是单纯调用某一个视频生成模型，而是把“选题、模板、旁白、分镜图片、语音、字幕、视频合成、成果展示”串成一条完整的内容生产流水线。

用户可以从一个短剧模板或自然语言主题开始，例如“豪门复仇短剧”“职场反击短剧”“带货口播视频”等，系统自动生成旁白文案、分镜图片、语音音频、字幕文件，并通过 FFmpeg 合成最终短视频。

产生这个想法的原因是：现在 AI 文生图、文生视频、TTS 工具很多，但普通用户真正要产出一条可发布的视频，仍然需要在多个工具之间来回切换，比如先写脚本，再生成图片，再配音，再做字幕，再剪辑合成。这个过程对非专业创作者来说门槛还是比较高。所以我希望做一个“从创意到视频结果”的工作流型应用，让 AI 不只是生成单个素材，而是参与完整内容生产流程。

产品形态目前是一个 Web 应用 MVP，后端基于 Spring Boot，前端基于 Vue3，支持登录、额度、任务追踪、生成结果展示和管理员配置中心。

2. 目标用户及痛点

目标用户主要有三类：

第一类是短视频内容创作者。
他们经常需要快速验证选题，比如短剧、爽文反转、带货口播、知识科普等，但每次从脚本到成片都要花很多时间。如果没有现成团队，就需要自己写文案、找素材、配音、加字幕、剪辑。

第二类是运营和自媒体从业者。
他们更关注内容产出效率，希望能快速生成一个视频 Demo，用于测试选题方向、脚本节奏和内容表达，而不是一开始就投入大量剪辑成本。

第三类是像我这样的开发者或 AI 应用探索者。
很多人想做 AI 应用，但容易停留在“调用一个模型接口”的阶段。我希望通过这个项目，把多个 AI 能力用工程化方式串起来，形成一个更接近产品的完整闭环。

当前痛点主要是：

AI 工具分散，素材生产和视频合成需要在多个平台之间手动流转。
单点 AI 生成不等于完整内容生产，缺少任务状态、结果管理、额度控制和失败处理。
普通用户不知道怎么把文本、图片、语音、字幕、视频合成成一个完整结果。
对开发者来说，AI 应用如果缺少登录、额度、后台配置、任务追踪等能力，很难从 Demo 变成可演示的产品雏形。

3. 价值与意义

从效率提升角度看，DramaFlow AI 可以把短视频生产中重复、繁琐的流程串起来。用户不需要反复切换多个工具，只需要选择模板或输入主题，就能得到一个完整的视频生成结果，用于快速预览、选题验证或后续二次编辑。

从商业价值角度看，它可以作为 AI 内容生产平台的 MVP 雏形，后续可以扩展到短剧批量生产、带货口播、知识科普、企业宣传、课程短视频等场景。它不是替代专业剪辑，而是降低从创意到第一版 Demo 的门槛。

从工程实践角度看，这个项目重点不在“训练一个视频模型”，而在“如何把多个 AI 能力工程化落地”。项目中拆分了文本生成、图片生成、语音生成、字幕生成和视频合成等能力，并通过 Provider 抽象支持 Mock、真实 AI 和运行时配置切换。

当前项目已经实现了：

模板 / 自然语言生成入口
用户可以选择短剧模板，也可以输入自然语言主题。
AI 旁白与分镜生成
支持规则旁白，也预留 DeepSeek 等文本模型能力。
图片、语音、字幕和视频合成链路
接入图片生成、TTS 语音、字幕生成，并通过 FFmpeg 合成最终视频。
用户额度与失败退款
真实 AI 生成会消耗额度，失败后自动退回，避免用户无感知损耗。
管理员配置中心
管理员可以控制图片数量、生成模式、默认视频参数等配置，普通用户不可见。
运行时动态配置
部分非敏感配置已经可以不重启服务直接生效，比如最大图片数量等。

这个项目的意义在于：它把 AI 从“单次生成工具”推进到“内容生产工作流”，更贴近实际业务场景，也更适合作为一个 Java 后端开发者探索 AI 应用工程化的作品。

4. 必须附带：TRAE Work 生成的创意产物 HTML 文件

本次作品会附带由 TRAE Work 生成的创意产物 HTML 文件，用于更完整展示 DramaFlow AI 的产品方案、功能流程、页面设计和演示思路。

HTML 展示内容建议包括：

项目介绍页
展示 DramaFlow AI 的定位：AI 短剧自动生成工作流平台。
核心流程图
模板 / 自然语言输入 → 旁白生成 → 图片生成 → 语音生成 → 字幕同步 → FFmpeg 合成 → 成果页展示。
用户端页面
展示 AI 视频生成页、模板预设、生成前确认弹窗、任务详情成果页。
管理员端页面
展示配置中心、额度规则、运行时动态配置、真实 AI 体验限制。
技术架构说明
展示 Spring Boot、Vue3、MySQL、DeepSeek、Qwen-Image、CosyVoice、FFmpeg 等技术栈。
创新点说明
强调本项目不是单一视频生成模型，而是面向短剧和口播内容生产的 AI 工作流 MVP。

项目技术栈

后端：Spring Boot、MyBatis Plus、MySQL、JWT、异步任务、额度系统
前端：Vue3、Element Plus、暗色科技风 UI
AI 能力：DeepSeek、Qwen-Image、CosyVoice
视频处理：FFmpeg、字幕音频同步
工程能力：用户隔离、任务追踪、失败退款、管理员配置中心、运行时动态配置

项目创新点总结

不是单纯的视频生成工具，而是 AI 短剧生产工作流平台。
将文本、图片、语音、字幕、视频合成串成完整链路。
支持用户侧生成和管理员侧配置，具备产品雏形。
支持额度控制和失败退款，考虑真实 AI 调用成本。
Provider 抽象可扩展，后续可接入 Seedance、可灵、即梦等视频模型。
使用 Java 后端工程化方式实现 AI 应用，而不是停留在单模型调用 Demo。

后续规划

后续我计划继续完善以下方向：

接入更强的视频生成模型，如 Seedance、可灵、即梦等，作为 Video Provider。
完善 Demo 模式，提供不消耗额度但效果较好的样例生成能力。
优化真实 AI 体验额度，限制成本并保障用户体验。
支持更多内容模板，例如带货口播、知识科普、企业宣传、课程短视频。
增加部署文档、线上演示环境和作品展示页。
继续优化字幕、音频、画面节奏，让生成结果更接近可发布视频。

DramaFlow AI 目前还是一个个人 MVP 项目，但它已经跑通了从创意输入到视频结果展示的完整链路。对我来说，这不仅是一个参赛作品，也是一次用 Java 后端工程化思维探索 AI 应用落地的实践。

创意产物

DramaFlow-AI-TRAE-Work.html (18.4 KB)