【标题】
【学习工作赛道】做一个 AI 短剧自动生成工作流平台
【标签】
学习工作
【正文】
1. 创意名称 + 创意介绍
创意名称:DramaFlow AI —— AI 短剧自动生成工作流平台
我想做的是一个面向短视频内容创作者、运营人员和个人开发者的 AI 短剧生产工具。它不是单纯调用某一个视频生成模型,而是把“选题、模板、旁白、分镜图片、语音、字幕、视频合成、成果展示”串成一条完整的内容生产流水线。
用户可以从一个短剧模板或自然语言主题开始,例如“豪门复仇短剧”“职场反击短剧”“带货口播视频”等,系统自动生成旁白文案、分镜图片、语音音频、字幕文件,并通过 FFmpeg 合成最终短视频。
产生这个想法的原因是:现在 AI 文生图、文生视频、TTS 工具很多,但普通用户真正要产出一条可发布的视频,仍然需要在多个工具之间来回切换,比如先写脚本,再生成图片,再配音,再做字幕,再剪辑合成。这个过程对非专业创作者来说门槛还是比较高。所以我希望做一个“从创意到视频结果”的工作流型应用,让 AI 不只是生成单个素材,而是参与完整内容生产流程。
产品形态目前是一个 Web 应用 MVP,后端基于 Spring Boot,前端基于 Vue3,支持登录、额度、任务追踪、生成结果展示和管理员配置中心。
2. 目标用户及痛点
目标用户主要有三类:
第一类是短视频内容创作者。
他们经常需要快速验证选题,比如短剧、爽文反转、带货口播、知识科普等,但每次从脚本到成片都要花很多时间。如果没有现成团队,就需要自己写文案、找素材、配音、加字幕、剪辑。
第二类是运营和自媒体从业者。
他们更关注内容产出效率,希望能快速生成一个视频 Demo,用于测试选题方向、脚本节奏和内容表达,而不是一开始就投入大量剪辑成本。
第三类是像我这样的开发者或 AI 应用探索者。
很多人想做 AI 应用,但容易停留在“调用一个模型接口”的阶段。我希望通过这个项目,把多个 AI 能力用工程化方式串起来,形成一个更接近产品的完整闭环。
当前痛点主要是:
-
AI 工具分散,素材生产和视频合成需要在多个平台之间手动流转。
-
单点 AI 生成不等于完整内容生产,缺少任务状态、结果管理、额度控制和失败处理。
-
普通用户不知道怎么把文本、图片、语音、字幕、视频合成成一个完整结果。
-
对开发者来说,AI 应用如果缺少登录、额度、后台配置、任务追踪等能力,很难从 Demo 变成可演示的产品雏形。
3. 价值与意义
从效率提升角度看,DramaFlow AI 可以把短视频生产中重复、繁琐的流程串起来。用户不需要反复切换多个工具,只需要选择模板或输入主题,就能得到一个完整的视频生成结果,用于快速预览、选题验证或后续二次编辑。
从商业价值角度看,它可以作为 AI 内容生产平台的 MVP 雏形,后续可以扩展到短剧批量生产、带货口播、知识科普、企业宣传、课程短视频等场景。它不是替代专业剪辑,而是降低从创意到第一版 Demo 的门槛。
从工程实践角度看,这个项目重点不在“训练一个视频模型”,而在“如何把多个 AI 能力工程化落地”。项目中拆分了文本生成、图片生成、语音生成、字幕生成和视频合成等能力,并通过 Provider 抽象支持 Mock、真实 AI 和运行时配置切换。
当前项目已经实现了:
-
模板 / 自然语言生成入口
用户可以选择短剧模板,也可以输入自然语言主题。 -
AI 旁白与分镜生成
支持规则旁白,也预留 DeepSeek 等文本模型能力。 -
图片、语音、字幕和视频合成链路
接入图片生成、TTS 语音、字幕生成,并通过 FFmpeg 合成最终视频。 -
用户额度与失败退款
真实 AI 生成会消耗额度,失败后自动退回,避免用户无感知损耗。 -
管理员配置中心
管理员可以控制图片数量、生成模式、默认视频参数等配置,普通用户不可见。 -
运行时动态配置
部分非敏感配置已经可以不重启服务直接生效,比如最大图片数量等。
这个项目的意义在于:它把 AI 从“单次生成工具”推进到“内容生产工作流”,更贴近实际业务场景,也更适合作为一个 Java 后端开发者探索 AI 应用工程化的作品。
4. 必须附带:TRAE Work 生成的创意产物 HTML 文件
本次作品会附带由 TRAE Work 生成的创意产物 HTML 文件,用于更完整展示 DramaFlow AI 的产品方案、功能流程、页面设计和演示思路。
HTML 展示内容建议包括:
-
项目介绍页
展示 DramaFlow AI 的定位:AI 短剧自动生成工作流平台。 -
核心流程图
模板 / 自然语言输入 → 旁白生成 → 图片生成 → 语音生成 → 字幕同步 → FFmpeg 合成 → 成果页展示。 -
用户端页面
展示 AI 视频生成页、模板预设、生成前确认弹窗、任务详情成果页。 -
管理员端页面
展示配置中心、额度规则、运行时动态配置、真实 AI 体验限制。 -
技术架构说明
展示 Spring Boot、Vue3、MySQL、DeepSeek、Qwen-Image、CosyVoice、FFmpeg 等技术栈。 -
创新点说明
强调本项目不是单一视频生成模型,而是面向短剧和口播内容生产的 AI 工作流 MVP。
项目技术栈
后端:Spring Boot、MyBatis Plus、MySQL、JWT、异步任务、额度系统
前端:Vue3、Element Plus、暗色科技风 UI
AI 能力:DeepSeek、Qwen-Image、CosyVoice
视频处理:FFmpeg、字幕音频同步
工程能力:用户隔离、任务追踪、失败退款、管理员配置中心、运行时动态配置
项目创新点总结
-
不是单纯的视频生成工具,而是 AI 短剧生产工作流平台。
-
将文本、图片、语音、字幕、视频合成串成完整链路。
-
支持用户侧生成和管理员侧配置,具备产品雏形。
-
支持额度控制和失败退款,考虑真实 AI 调用成本。
-
Provider 抽象可扩展,后续可接入 Seedance、可灵、即梦等视频模型。
-
使用 Java 后端工程化方式实现 AI 应用,而不是停留在单模型调用 Demo。
后续规划
后续我计划继续完善以下方向:
-
接入更强的视频生成模型,如 Seedance、可灵、即梦等,作为 Video Provider。
-
完善 Demo 模式,提供不消耗额度但效果较好的样例生成能力。
-
优化真实 AI 体验额度,限制成本并保障用户体验。
-
支持更多内容模板,例如带货口播、知识科普、企业宣传、课程短视频。
-
增加部署文档、线上演示环境和作品展示页。
-
继续优化字幕、音频、画面节奏,让生成结果更接近可发布视频。
DramaFlow AI 目前还是一个个人 MVP 项目,但它已经跑通了从创意输入到视频结果展示的完整链路。对我来说,这不仅是一个参赛作品,也是一次用 Java 后端工程化思维探索 AI 应用落地的实践。
创意产物
DramaFlow-AI-TRAE-Work.html (18.4 KB)