【More than Coding】用SOLO开发自动生成小说SKILL

SOLO 挑战赛参赛作品
NovelForge —— 智能小说创作工具包

基于 TRAE SOLO 从零到一完成的 Agent Skill 全流程开发实践
标签:Code with SOLO
日期:2026年4月13日


一、摘要

本项目使用 TRAE SOLO 从零开始,完成了一个完整的 Agent Skill 项目——NovelForge(智能小说创作工具包)。该工具包覆盖交互式开书引导、世界观设定、人物创建、大纲设计、智能写作、润色、六维审核评分、网络趋势分析、多格式导出等全流程功能,共产出 25 个 Python 源文件、4050+ 行代码、198 个单元测试全部通过。
项目的核心亮点是交互式开书引导工作流:当用户说"开新书"时,Agent 会通过 10 步逐步引导,每步提供多个候选选项供用户选择,包括热门趋势参考、长篇/短篇确认、文风学习、书名生成、世界观构建、人物创建、大纲确认、黄金三章写作等全流程。整个过程包括需求分析、架构设计、三轮设计评审(42项优化)、分阶段开发、提示词工程、规范适配(ClawHub)和打包发布。

二、背景

我是一名全栈开发者,对 AI Agent 技能生态感兴趣。在网络小说创作领域,作者常常需要同时处理世界观设定、人物关系、伏笔管理、去AI化写作、平台红线检测等复杂任务,传统工具难以统一管理。
我希望利用 TRAE SOLO 构建一个完整的 Agent Skill 项目,让 AI 能够理解小说创作的全流程,并以结构化的方式协助作者从选题到成稿。这不仅是一个工具开发项目,更是一次对 AI 辅助复杂软件工程能力边界的探索。
在实践中,我发现仅仅有代码还不够——Agent 的交互体验同样重要。如果 AI 一次性生成所有内容,用户很难控制方向。因此我重点设计了交互式引导工作流,让 Agent 像一位经验丰富的编辑一样,逐步引导用户完成开书全过程。

三、实践过程
3.1 任务拆解与需求分析
我将整个项目拆解为三个核心技能,通过多轮对话逐步明确需求:
技能 职责 关键能力
novel-writer 小说写作全流程 交互式开书/世界观/人设/大纲/写作/润色/审核
trend-analyzer 网络趋势分析 4平台爬取/关键词提取/类型统计
doc-exporter 多格式导出 TXT/Markdown/Word/EPUB
3.2 架构设计
通过多轮对话迭代确定了清晰的分层架构,项目包含:
shared/(公共基础设施层):数据库、存储、配置、错误码、工具函数、上下文管理、文件监控
skills/(novel-writer、trend-analyzer、doc-exporter):三大核心技能
references/(9个指南 + 9个提示词模板):参考文档与提示词工程
tests/(198个单元测试):完整测试覆盖
核心设计决策包括:
双层存储:SQLite(元数据)+ 本地文件(正文),支持 WAL 模式并发读写
六维审核体系:红线30% + 逻辑20% + OOC20% + 去AI化15% + 伏笔10% + 可读性5%
审核闭环:写作→润色→审核→打回修改(最多3次循环)
去AI化策略:6类AI特征检测(对称结构/堆叠修饰/空洞情感/模板开头/过渡词滥用/排比三连)
交互式引导工作流:10步逐步引导,每步提供候选选项,绝不跳步
3.3 设计评审与迭代优化
三轮评审累计发现并修复 42 项优化:
第一轮 24 项:功能完整性(补充缺失功能、完善错误处理)
第二轮 13 项:一致性与健壮性(统一命名、边界检查、事务安全)
第三轮 5 项:细节打磨(日志优化、配置管理、版本历史)
3.4 分阶段开发
6 阶段开发计划全部完成:
阶段 内容 状态
Phase 1 基础架构与写作 MVP :white_check_mark: 完成
Phase 2 审核润色流程 :white_check_mark: 完成
Phase 3 趋势分析增强 :white_check_mark: 完成
Phase 4 导出功能增强 :white_check_mark: 完成
Phase 5 高级功能(会话恢复/文件监控) :white_check_mark: 完成
Phase 6 发布准备(规范适配/打包) :white_check_mark: 完成
3.5 交互式开书引导工作流(核心亮点)
这是本项目最重要的设计创新。传统的 AI 写作工具往往一次性生成所有内容,用户难以控制方向。NovelForge 设计了 10 步交互式引导流程,每步都提供多个候选选项供用户选择,绝不跳步:
步骤 内容 交互方式
1 选题方向 调用 trend-analyzer 获取热门趋势,展示 3-5 个方向供选择
2 作品类型 根据题材提供 3-4 个子类型候选
3 长篇/短篇 长篇连载(100万+) / 中篇(20-100万) / 短篇(20万内)
4 文风确认 默认网文爽文 / 参考某部作品 / 自定义风格
5 书名确认 生成 3-5 个候选书名供选择
6 世界观设定 分 2-3 轮提问,逐步构建完整世界观
7 核心人物创建 逐个创建 2-3 个核心角色,展示人物卡片确认
8 生成大纲 分卷大纲 + 黄金三章详细规划,用户确认/修改
9 确认开始写作 强调黄金三章重要性,确认后开始
10 黄金三章写作 逐章写作→自动润色→自动审核→评分通过后继续
交互原则:每步只问一个问题、始终提供候选选项、语气友好热情、允许自由输入、展示中间成果、记住用户选择。
3.6 提示词工程
为了让 Agent 能够精确执行每个步骤,我设计了完整的提示词模板体系,共 9 个模板:
模板文件 用途 内容要点
prompt_onboarding.md 开书引导(新增) 10步交互流程 + 文件存储规范 + 异常处理
prompt_writing.md 章节写作 4种写作模式 + 黄金三章规则 + 去AI化要求
prompt_outline.md 大纲生成 分卷原则 + 节奏设计 + 黄金三章标注
prompt_character.md 人物创建 档案字段 + 主角/反派/配角创建重点
prompt_worldbuilding.md 世界观设定 6大题材模板 + 自洽性/故事性/可写性检查
prompt_style_learning.md 文风学习 3种学习模式 + 文风档案结构 + 默认网文风格
prompt_polishing.md 润色优化 5维润色 + AI特征检测表 + 修改前后对比示例
prompt_review.md 审核评分 6维审核体系 + 详细评分标准 + 输出格式
prompt_rename.md 改名同步 全局事务性流程 + 错误处理
每个模板都包含角色定义、任务目标、输入上下文、执行规则、输出格式和约束规则,确保 Agent 能够精确执行。
3.7 文件存储规范
为了确保交互引导完成后的写作过程严格遵循目录规范,在 SKILL.md 和提示词模板中强制定义了文件存储结构:
文件类型 命名格式 示例
章节文件 第{NNN}章_{章节名}.txt 第001章_今天也是努力求生的一天.txt
版本历史 第{NNN}章_{章节名}_v{N}.txt 第001章_今天也是努力求生的一天_v2.txt
人物档案 {角色名}.txt 林逸.txt
简介文件 简介.txt 固定名称
大纲文件 大纲.txt 固定名称
目录结构:

NovelForge/
└── {书名}/
    ├── 简介.txt
    ├── 大纲.txt
    ├── 正文/                  ← 所有章节存放于此
    │   ├── 第001章_章节名.txt
    │   ├── 第002章_章节名.txt
    │   └── .history/          ← 版本历史
    └── 人物/                  ← 人物档案存放于此
        └── {角色名}.txt

关键规则:章节号3位零填充(第001章)、下划线分隔、正文必须放 正文/ 子目录、人物档案必须放 人物/ 子目录。

3.8 关键踩坑记录
开发过程中记录了 5 个典型问题及解决方案:
目录名连字符导入问题:skills/novel-writer 中的连字符导致 Python 无法直接 import,通过 sys.path 动态注册解决
全局数据库单例污染测试:测试间共享数据库实例导致测试串行,通过 tmp_path 隔离解决
f-string 中文引号冲突:中文引号与 Python 字符串引号混用导致语法错误,统一使用英文引号
docx-js 生成文档语法错误:XML 实体与 JavaScript 转义混淆,统一使用 JS 转义
平台解耦:初始版本绑定特定 Agent 平台,重构为通用技能格式兼容任意 Agent 框架

四、成果展示

指标 数据
Python 源文件 25 个
代码行数 4,050+ 行
单元测试 198 个(全部通过)
测试文件 8 个
SKILL.md 技能入口 4 个(根 + 3个子技能)
提示词模板 9 个(全部从占位符完善为完整内容)
参考文档 18 个(9个指南 + 9个提示词)
数据库表 10 表 + 6 索引
导出格式 TXT / Markdown / Word / EPUB
支持平台爬取 起点、番茄、晋江、七猫
压缩包大小 93 KB
项目版本 v1.1.0
规范适配 ClawHub Skill Format

五、效果与总结
从需求分析到完成 MVP 约需 2 小时,设计评审三轮累计 42 项优化,代码开发 6 个 Phase 全部完成,单元测试通过率 100%。在此基础上,进一步完成了三项重要迭代:
交互式开书引导:设计了 10 步逐步引导工作流,每步提供候选选项,让 Agent 像专业编辑一样引导用户开书
提示词工程:将 8 个占位符模板全部完善为完整的提示词文档,新增开书引导模板,总计 9 个
文件存储规范:强制定义目录结构和命名规则,确保引导完成后的写作过程严格遵循规范
后续规划:
接入真实 LLM 实现端到端写作体验
添加章节合并/拆分功能
发布到 ClawHub 技能市场
支持更多平台趋势爬取

这个帖子也是solo直接生成的,哈哈

1 个赞