【Code With SOLO】用 SOLO 48小时"修仙":我把《凡人修仙传》小说变成了AI能读懂的数据库

【Code With SOLO】用 SOLO 48小时"修仙":我把《凡人修仙传》小说变成了AI能读懂的数据库

一、摘要

作为一个想开发 MUD 游戏但懒得读完整本小说的程序员,我决定让 AI 帮我"修仙"。用 TRAE SOLO 48 小时,我构建了一套完整的小说数据结构化系统,自动从 358 章《凡人修仙传》(人界部分)中提取出 2067 个角色、2377 条关系、966 个事件。现在 AI 比我更懂韩立有多少个道侣了(虽然答案是零,毕竟他是正经修仙的)。

二、背景

小时候我是曾是一名MUD开发者,突然想搞点有意思的——做个基于《凡人修仙传》的 MUD 游戏。但问题来了:

  • 小说(人界部分)就有 358 章,人名比我家亲戚还多
  • 韩立到底有多少师父?墨大夫、李化元、大衍神君…数不过来
  • 黄枫谷和掩月宗到底什么关系?敌对还是暧昧?

手动整理?不存在的。我的修仙之路第一步,是先让 AI 帮我把小说"吃"进去。

三、实践过程

3.1 任务拆解

我把这个"AI 修仙"项目拆成了几个阶段:

  1. 文本预处理:把小说从各种奇怪编码(GBK、BIG5、甚至可能是上古符文)转成 UTF-8
  2. 实体提取:让 LLM 当"人名识别器",找出所有角色、门派、功法、法宝
  3. 关系抽取:分析谁是谁的师父、谁跟谁打过架、谁暗恋谁
  4. Web 管理界面:做一个酷炫的仙侠风格后台,毕竟修仙也要有排面

3.2 使用 SOLO 的能力

智能代码生成:我跟 SOLO 说"我要一个仙侠风格的 Web 界面",它直接给我生成了带毛玻璃效果、动态光斑、金色配色的页面。我怀疑 SOLO 偷偷看过《仙剑奇侠传》。

多步骤任务规划:当我不知道从何下手时,SOLO 自动帮我把"提取小说数据"这个大目标拆解成可执行的小任务,就像有个资深架构师在旁边指导。

实时预览与调试:每改一行代码都能立刻看到效果,不用反复重启服务。这种感觉就像修仙有了"即时反馈"的外挂。

3.3 关键 Prompt 与操作过程

Prompt 1(项目启动):

帮我创建一个《凡人修仙传》小说数据结构化的系统,需要支持上传 txt 文件、自动提取角色/门派/功法/法宝等实体、分析人物关系,要有仙侠风格的 Web 管理界面

Prompt 2(LLM 集成):

集成 LLM 服务来做 NER 和关系抽取,要支持断点续传,因为处理 358 章小说可能会很久,中间不能崩

Prompt 3(错误处理):

如果 LLM API 调用失败,要停止任务并返回清晰错误,不要给我返回假数据让我误以为修成了仙

3.4 踩过的坑

编码地狱:最初上传的 txt 文件是 GBK 编码,系统直接报错。我让 SOLO 加了自动编码检测和转换,现在不管是什么"上古符文"都能识别。

LLM 的"幻觉":一开始 LLM 会把"韩立"和"韩老魔"当成两个人。我优化了 Prompt,让它做实体消歧,现在它知道这是同一个人(虽然性格确实像两个人)。

进度条玄学:处理到第 39 章时进度条突然显示"undefined%"。查了半天发现是检查点恢复逻辑的问题。修复后,现在可以从中断处继续,不用担心"走火入魔"要重来。

数据统计为零:处理到第 6 章时,数据面板显示全是 0。原来 API 只从已完成任务取数据,我改成优先从进行中的任务实时获取,现在能看到实时进度了。

四、成果展示

4.1 项目地址

GitHub: GitHub - zero9k/im_data: 小说数据结构话系统 · GitHub

4.2 系统架构

组件 技术栈 说明
前端 HTML5 + CSS3 + JS 仙侠风格,毛玻璃效果,动态光斑
后端 Flask + Python RESTful API,支持文件上传和任务管理
LLM 服务 第三方 API 实体识别、关系抽取
数据存储 JSON 文件 检查点和处理结果

4.3 处理成果

数据类型 数量 说明
实体 2,067 角色、地点、门派、功法、物品
关系 2,377 师徒、朋友、敌人、同门等
事件 966 战斗、突破、寻宝、结仇等
章节 358 《凡人修仙传》人界篇全部

4.4 核心功能

  • 文件上传:支持拖拽上传 txt 文件,自动检测编码并转为 UTF-8
  • 实时进度:处理进度实时显示,包括当前章节、百分比、预计剩余时间
  • 断点续传:处理中断后可从检查点恢复,不用从头再来
  • 数据可视化:实体分布、关系网络、时间线等多种视图
  • 任务管理:支持暂停、恢复、取消任务

4.5 界面截图

(有代码了就不截图了)

五、效果与总结

提效对比

任务 手动处理 AI 辅助 提效
整理角色列表 2-3 天 2 小时 36 倍
梳理人物关系 1 周+ 4 小时 42 倍
构建事件时间线 无法完成 自动提取

修仙感悟

  1. AI 不会取代程序员,但会用 AI 的程序员会取代不用 AI 的。就像韩立不会法术,但他有小绿瓶。

  2. Prompt 工程是新时代的"法术咒语"。写得好,AI 就是你的灵宠;写不好,AI 就是你的心魔。

  3. 断点续传很重要。修仙路上总会遇到瓶颈,保存进度才能继续突破。

  4. SOLO 让我体验到了"一人成军"的感觉。以前这种项目需要一个团队,现在一个人 + AI 就能搞定。

可复用的方法

  • 长文本处理一定要做分块和检查点
  • LLM 输出要加校验,防止"幻觉"
  • Web 界面要有实时反馈,让用户知道 AI 在干活
  • 错误处理要清晰,不要让用户猜发生了什么

修仙之路漫漫,AI 助你一臂之力 :dagger:

@韩立@玄骨@南宫婉@厉飞雨

1 个赞

凡人谜?
:+1: