【Code With SOLO】用 SOLO 48小时"修仙":我把《凡人修仙传》小说变成了AI能读懂的数据库
一、摘要
作为一个想开发 MUD 游戏但懒得读完整本小说的程序员,我决定让 AI 帮我"修仙"。用 TRAE SOLO 48 小时,我构建了一套完整的小说数据结构化系统,自动从 358 章《凡人修仙传》(人界部分)中提取出 2067 个角色、2377 条关系、966 个事件。现在 AI 比我更懂韩立有多少个道侣了(虽然答案是零,毕竟他是正经修仙的)。
二、背景
小时候我是曾是一名MUD开发者,突然想搞点有意思的——做个基于《凡人修仙传》的 MUD 游戏。但问题来了:
- 小说(人界部分)就有 358 章,人名比我家亲戚还多
- 韩立到底有多少师父?墨大夫、李化元、大衍神君…数不过来
- 黄枫谷和掩月宗到底什么关系?敌对还是暧昧?
手动整理?不存在的。我的修仙之路第一步,是先让 AI 帮我把小说"吃"进去。
三、实践过程
3.1 任务拆解
我把这个"AI 修仙"项目拆成了几个阶段:
- 文本预处理:把小说从各种奇怪编码(GBK、BIG5、甚至可能是上古符文)转成 UTF-8
- 实体提取:让 LLM 当"人名识别器",找出所有角色、门派、功法、法宝
- 关系抽取:分析谁是谁的师父、谁跟谁打过架、谁暗恋谁
- Web 管理界面:做一个酷炫的仙侠风格后台,毕竟修仙也要有排面
3.2 使用 SOLO 的能力
智能代码生成:我跟 SOLO 说"我要一个仙侠风格的 Web 界面",它直接给我生成了带毛玻璃效果、动态光斑、金色配色的页面。我怀疑 SOLO 偷偷看过《仙剑奇侠传》。
多步骤任务规划:当我不知道从何下手时,SOLO 自动帮我把"提取小说数据"这个大目标拆解成可执行的小任务,就像有个资深架构师在旁边指导。
实时预览与调试:每改一行代码都能立刻看到效果,不用反复重启服务。这种感觉就像修仙有了"即时反馈"的外挂。
3.3 关键 Prompt 与操作过程
Prompt 1(项目启动):
帮我创建一个《凡人修仙传》小说数据结构化的系统,需要支持上传 txt 文件、自动提取角色/门派/功法/法宝等实体、分析人物关系,要有仙侠风格的 Web 管理界面
Prompt 2(LLM 集成):
集成 LLM 服务来做 NER 和关系抽取,要支持断点续传,因为处理 358 章小说可能会很久,中间不能崩
Prompt 3(错误处理):
如果 LLM API 调用失败,要停止任务并返回清晰错误,不要给我返回假数据让我误以为修成了仙
3.4 踩过的坑
编码地狱:最初上传的 txt 文件是 GBK 编码,系统直接报错。我让 SOLO 加了自动编码检测和转换,现在不管是什么"上古符文"都能识别。
LLM 的"幻觉":一开始 LLM 会把"韩立"和"韩老魔"当成两个人。我优化了 Prompt,让它做实体消歧,现在它知道这是同一个人(虽然性格确实像两个人)。
进度条玄学:处理到第 39 章时进度条突然显示"undefined%"。查了半天发现是检查点恢复逻辑的问题。修复后,现在可以从中断处继续,不用担心"走火入魔"要重来。
数据统计为零:处理到第 6 章时,数据面板显示全是 0。原来 API 只从已完成任务取数据,我改成优先从进行中的任务实时获取,现在能看到实时进度了。
四、成果展示
4.1 项目地址
GitHub: GitHub - zero9k/im_data: 小说数据结构话系统 · GitHub
4.2 系统架构
| 组件 | 技术栈 | 说明 |
|---|---|---|
| 前端 | HTML5 + CSS3 + JS | 仙侠风格,毛玻璃效果,动态光斑 |
| 后端 | Flask + Python | RESTful API,支持文件上传和任务管理 |
| LLM 服务 | 第三方 API | 实体识别、关系抽取 |
| 数据存储 | JSON 文件 | 检查点和处理结果 |
4.3 处理成果
| 数据类型 | 数量 | 说明 |
|---|---|---|
| 实体 | 2,067 | 角色、地点、门派、功法、物品 |
| 关系 | 2,377 | 师徒、朋友、敌人、同门等 |
| 事件 | 966 | 战斗、突破、寻宝、结仇等 |
| 章节 | 358 | 《凡人修仙传》人界篇全部 |
4.4 核心功能
- 文件上传:支持拖拽上传 txt 文件,自动检测编码并转为 UTF-8
- 实时进度:处理进度实时显示,包括当前章节、百分比、预计剩余时间
- 断点续传:处理中断后可从检查点恢复,不用从头再来
- 数据可视化:实体分布、关系网络、时间线等多种视图
- 任务管理:支持暂停、恢复、取消任务
4.5 界面截图
(有代码了就不截图了)
五、效果与总结
提效对比
| 任务 | 手动处理 | AI 辅助 | 提效 |
|---|---|---|---|
| 整理角色列表 | 2-3 天 | 2 小时 | 36 倍 |
| 梳理人物关系 | 1 周+ | 4 小时 | 42 倍 |
| 构建事件时间线 | 无法完成 | 自动提取 | ∞ |
修仙感悟
-
AI 不会取代程序员,但会用 AI 的程序员会取代不用 AI 的。就像韩立不会法术,但他有小绿瓶。
-
Prompt 工程是新时代的"法术咒语"。写得好,AI 就是你的灵宠;写不好,AI 就是你的心魔。
-
断点续传很重要。修仙路上总会遇到瓶颈,保存进度才能继续突破。
-
SOLO 让我体验到了"一人成军"的感觉。以前这种项目需要一个团队,现在一个人 + AI 就能搞定。
可复用的方法
- 长文本处理一定要做分块和检查点
- LLM 输出要加校验,防止"幻觉"
- Web 界面要有实时反馈,让用户知道 AI 在干活
- 错误处理要清晰,不要让用户猜发生了什么
修仙之路漫漫,AI 助你一臂之力 ![]()