一个人，13天，5万行代码：用 Trae Solo 从零构建企业级 AI 智能客服系统

用户45476 · 2026 年5 月 10 日 04:10

前言：为什么选择 Trae Solo？
2026 年，AI 编程工具已经从"代码补全"进化到"全流程自主开发"。作为一名开发者，我一直在思考一个问题：AI 到底能独立完成多复杂的项目？

为了验证这个问题的边界，我决定用 Trae Solo 的 SOLO 模式，从零开始构建一个完整的企业级 AI 智能客服系统——不是玩具 Demo，而是真正能上线运营的生产级系统。

最终结果：13 天，约 5 万行代码，6 个 Maven 子模块 + 前端工程，30 个业务页面，42 张数据库表，8 个 Docker 服务。

这篇文章记录了整个开发过程中的经验、踩坑和思考，希望能给正在探索 AI 全流程开发的同学一些参考。

一、项目概述：我要做什么？
1.1 项目定位
我要构建的是一个 AI 驱动的智能客服系统，面向的是一个真实的业务场景——游戏陪玩俱乐部的客户服务。系统需要具备以下核心能力：

AI 智能对话：接入大语言模型，实现自然语言客服
多平台接入：支持微信公众号、企业微信等消息渠道
工单系统：完整的工单创建、分配、处理、升级流程
客户画像：客户生命周期管理、满意度追踪
运营管理：陪玩师管理、订单管理、数据报表
企业级安全：JWT 认证、RBAC 权限、审计日志、数据脱敏
1.2 技术选型
层级技术选型版本
后端框架 Spring Boot 3.5.14
编程语言 Java (Virtual Threads) 21
ORM MyBatis-Plus 3.5.16
数据库 MySQL + Druid 8.0
缓存/消息 Redis + Redisson 7 / 3.25.2
AI 模型 DeepSeek API -
前端框架 Vue 3 + TypeScript 3.4 / 6
UI 组件 Element Plus 2.5
构建工具 Vite 5
部署 Docker Compose (8 服务) -
为什么选 Java 21 + Spring Boot 3.5？这是目前 Java 生态中最新的稳定版本组合，支持虚拟线程（Virtual Threads），对于 I/O 密集型的客服系统来说，虚拟线程能显著提升并发处理能力。同时，Trae Solo 对 Java 生态的支持已经相当成熟。

二、开发策略：如何让 AI 高效交付复杂项目？
2.1 核心原则：人是掌舵人，AI 是水手
在 13 天的开发过程中，我总结出了一套与 Trae Solo 协作的方法论：

原则一：分而治之，绝不一口吃成胖子

对于这种 5 万行级别的项目，直接告诉 AI “帮我做一个客服系统” 是不可能成功的。我的策略是：

Plain Text

1
2
3
4
5
6
第 1-2 天：项目骨架搭建 + 数据库设计
第 3-5 天：核心业务模块（认证、用户、客户管理）
第 6-8 天：AI 客服核心（消息处理、关键词匹配、大模型集成）
第 9-10 天：工单系统 + 运营模块
第 11-12 天：前端 30 个页面
第 13 天：Docker 部署 + 联调测试
每一天都有明确的目标和验收标准，AI 只需要完成当天的任务。

原则二：先架构，后编码

在让 AI 写任何业务代码之前，我先手动完成：

Maven 多模块的 pom.xml 依赖管理
数据库表结构设计（42 张表）
项目的包结构和分层规范
公共基础类（BaseEntity、统一响应、全局异常处理）
这些"地基"工作看似简单，却决定了整个项目的代码质量上限。

原则三：接口先行，分步实现

每个模块的开发流程：

先让 AI 设计 Service 接口（只定义方法签名）
评审接口设计是否合理
再让 AI 逐个实现方法
每完成一个方法，立即验证
这种方式比"一次性生成整个 Service"的成功率高得多。

2.2 模块化拆分的艺术
项目最终拆分为 6 个 Maven 子模块：

Plain Text

1
2
3
4
5
6
7
delta-ai-customer-service (父 POM)
├── delta-common-core # 基础工具、配置、注解、切面
├── delta-common-entity # 实体类、DTO、VO、枚举、常量
├── delta-common-service # Service 接口与实现
├── delta-admin # Controller、Security、WebSocket
├── delta-message # AI 消息处理（DeepSeek 集成）
└── delta-platform # 平台接入（微信、企业微信）
为什么要拆这么细？因为 AI 在处理小模块时准确率远高于处理大模块。每个子模块职责单一，AI 生成的代码质量明显更好，编译和调试的速度也更快。

三、AI 客服系统：核心技术亮点
声明：以下内容仅分享架构设计思路和技术方案，不包含完整实现细节和核心业务逻辑代码。

3.1 五层消息处理流水线
这是整个系统最核心的设计。每一条用户消息都会经过五层处理：

Plain Text

1
2
3
4
5
6
7
8
9
10
11
用户消息
↓
[第一层] 内容安全检查 —— DFA 敏感词过滤 + 正则匹配隐私信息 + 消息去重
↓
[第二层] 转人工状态检测 —— 检查用户是否已在等待队列或服务中
↓
[第三层] 关键词匹配 —— Trie 树 O(n) 匹配，命中则直接返回预设回复
↓
[第四层] AI 智能生成 —— DeepSeek + 知识库注入 + 情绪感知 + 人格配置
↓
[第五层] 兜底转人工 —— AI 生成失败时自动转人工处理
设计思路：关键词匹配优先于 AI 生成，既保证了常见问题的秒级响应速度，又能让 AI 专注于处理复杂问题。这种"快速通道 + 智能通道"的双轨设计，在实际运营中效果非常好。

3.2 情绪智能系统
这是我认为整个项目最有创意的部分。系统不是简单地"回复消息"，而是能感知用户的情绪变化：

情绪评分模型：基于关键词匹配 + 上下文分析，输出 1-10 分的情绪值
惯性平滑算法：新消息权重 0.3，历史权重 0.7，避免情绪"跳变"
四级情绪分级：正面 → 轻微负面 → 负面 → 愤怒
趋势追踪：判断用户情绪是在恶化、改善还是稳定
自动转人工触发：连续 3 次负面或检测到愤怒时，自动建议转人工
为什么需要情绪感知？因为在游戏陪玩场景中，用户情绪波动很大。一个因为排位连败而愤怒的玩家，如果 AI 还在用标准话术回复，只会火上浇油。情绪感知让系统能够"读懂"用户，做出更恰当的回应。

3.3 AI 成本优化策略
接入大模型 API 最大的隐形成本就是 Token 消耗。我在设计中做了多层优化：

优化策略效果
智能 FAQ 注入仅注入相关的 1-2 条 FAQ，节省约 1500 tokens/次
AI 回复缓存相同消息 10 分钟内复用，减少重复调用
系统提示词压缩精简冗余描述，节省约 700 tokens/次
对话历史压缩仅保留最近 4 条有效历史，控制上下文长度
每日 Token 监控超 50 万阈值自动告警
这些优化加起来，单次对话的 Token 消耗降低了约 40%，在保证回复质量的同时显著降低了运营成本。

3.4 多平台适配器模式
系统需要同时接入微信公众号和企业微信，两个平台的消息格式完全不同。我采用了适配器模式 + 模板方法模式的组合：

定义统一的 BaseMessageProcessService 抽象基类，封装通用的五层处理流程
每个平台实现自己的适配器，只关注平台特有的消息解析和回复发送
新增平台接入时，只需实现适配器即可，核心处理逻辑完全复用
这种设计让系统具备了良好的可扩展性。

四、企业级安全：不只是能跑，还要安全
4.1 十层安全防护体系
作为企业级系统，安全性是必须重点考虑的。我在系统中实现了十层安全防护：

Plain Text

1
2
3
4
5
6
7
8
9
10
11
12
┌─────────────────────────────────────────┐
│ 第 1 层：JWT 双 Token 认证 │
│ 第 2 层：RBAC 三级角色权限控制 │
│ 第 3 层：TOTP 二级认证（2FA） │
│ 第 4 层：全局 XSS 过滤（12 种攻击向量） │
│ 第 5 层：Redis Lua 滑动窗口限流 │
│ 第 6 层：@AuditLog 审计日志（AOP 切面） │
│ 第 7 层：业务 ID 混淆（防遍历攻击） │
│ 第 8 层：DFA 敏感词过滤（6 万+词库） │
│ 第 9 层：数据脱敏（手机号/邮箱/密钥） │
│ 第 10 层：Token 黑名单 + 防权限提升 │
└─────────────────────────────────────────┘
4.2 几个有意思的安全设计
ID 混淆机制：数据库自增 ID 直接暴露给前端是非常危险的（容易被遍历）。我设计了一套 ID 混淆方案，对外暴露 d_xxxx 格式的混淆 ID，配合 Jackson 自定义序列化器，在 API 响应中自动转换，业务代码完全无感知。

并发 Token 刷新：前端多个请求同时 401 时，如何避免重复刷新 Token？我实现了一个 refreshLock + refreshSubscribers 队列机制——第一个 401 触发刷新，后续请求排队等待，刷新完成后统一重发。

审计日志独立通道：通过自定义 Logger (AUDIT_LOG) + Logback 独立 Appender，审计日志与业务日志物理隔离，便于安全审计和合规归档。

五、前端工程化：30 个页面的高效开发
5.1 前端规模
30 个业务页面：Dashboard、客户管理、陪玩师排班、工单处理、AI 配置、数据报表等
6 个通用组件：骨架屏、懒加载图片、错误边界、加载遮罩、页面进度条、异步组件包装器
36 个 E2E 测试文件（Cypress）
5.2 与 Trae Solo 协作开发前端的技巧
技巧一：先定义路由结构，再逐页面生成

我先手动写好完整的路由配置（包含权限 meta 信息），然后让 AI 逐个生成页面组件。这样能确保整体导航结构符合预期，AI 只需要关注单个页面的实现。

技巧二：提供 UI 规范，保持视觉一致性

我给 AI 提供了一份简洁的 UI 规范：

表格页面的标准布局（搜索栏 + 操作栏 + 表格 + 分页）
表单页面的标准布局（描述信息 + 表单 + 提交/取消按钮）
统一的配色方案和间距规范
这样 AI 生成的 30 个页面风格高度统一，不会出现"每个页面长得不一样"的问题。

技巧三：手动处理交互细节

AI 生成的页面功能基本可用，但用户体验的细节需要人工打磨：

错误提示的文案优化
加载状态的展示时机
表单验证的提示信息
页面切换的过渡动画
这些"最后一公里"的工作，人工介入比让 AI 反复调整更高效。

5.3 会话管理器
前端实现了一个完整的会话管理器，这是一个容易被忽略但非常重要的功能：

桌面端 30 分钟 / 移动端 15 分钟空闲超时自动登出
每 2 分钟心跳检测
页面关闭时通过 sendBeacon 发送会话结束事件
网络恢复时自动尝试刷新 Token
页面可见性变化时检测 Token 有效性
六、部署与可观测性：一键上线的完整方案
6.1 八服务 Docker Compose 编排
最终的生产部署方案包含 8 个 Docker 服务：

服务用途
MySQL 8.0 业务数据库
Redis 7 缓存 + 消息队列 + 分布式锁
Backend Spring Boot 应用
Nginx 反向代理 + 前端静态资源 + WebSocket 代理
Prometheus 指标采集
Grafana 可视化监控面板
Loki 日志聚合
Promtail 日志采集 Agent
6.2 多阶段构建优化
Dockerfile 采用多阶段构建：

构建阶段：Maven 3.9 + JDK 21 编译打包，利用 Docker 缓存层优化依赖下载
运行阶段：eclipse-temurin:21-jre-alpine 精简镜像，最终镜像体积控制在 200MB 以内
七、与 Trae Solo 协作的经验总结
7.1 什么 AI 做得好？
标准 CRUD 代码生成：Entity、Mapper、Service、Controller 这类标准化的代码，AI 生成质量非常高，几乎不需要修改。

配置文件编写：Spring Security 配置、Redis 配置、MyBatis-Plus 配置等，AI 能根据需求准确生成。

测试代码编写：单元测试、E2E 测试的生成质量超出预期，特别是边界条件的覆盖。

Docker/部署配置：Dockerfile、docker-compose.yml、Nginx 配置等基础设施代码，AI 非常擅长。

代码重构：将一个大 Service 拆分为多个小 Service，或者提取公共方法，AI 做得又快又好。

7.2 什么需要人工把控？
业务架构设计：模块划分、领域模型设计、核心业务流程，这些需要人工决策。

AI 提示词调优：系统提示词的设计对 AI 客服质量影响巨大，需要反复调试。

安全策略制定：安全方案需要根据实际业务场景定制，不能完全交给 AI。

用户体验打磨：交互细节、视觉一致性、错误处理体验，需要人工介入。

性能调优：SQL 优化、缓存策略、并发控制，需要结合实际数据量来调整。

7.3 效率提升数据
维度传统开发（估） Trae Solo 提升倍数
标准业务模块 2-3 天/模块 0.5-1 天/模块 ~3x
配置/部署文件 1-2 天 2-3 小时 ~5x
测试代码 1-2 天 2-4 小时 ~4x
前端页面 0.5-1 天/页 1-2 小时/页 ~4x
整体项目 2-3 个月 13 天 ~5x
八、踩坑记录
坑 1：让 AI 一次生成太多代码
症状：AI 生成的代码看起来没问题，但运行后各种奇怪的错误。

原因：上下文窗口有限，AI 在处理大量代码时容易"遗忘"前面的约束。

解决：分步生成，每步不超过 200 行代码，生成后立即验证。

坑 2：模块间依赖循环
症状：Maven 编译报循环依赖错误。

原因：AI 在生成代码时没有全局视角，可能在 common 模块中引用了 admin 模块的类。

解决：在 pom.xml 中明确依赖方向，每次让 AI 生成新代码时提醒它当前的模块边界。

坑 3：前端状态管理混乱
症状：多个页面共享的数据不一致，刷新后状态丢失。

原因：AI 生成页面时各自管理状态，没有统一的 Pinia Store 设计。

解决：先手动设计 Pinia Store 结构，再让 AI 在页面中使用。

坑 4：AI 生成的 SQL 性能问题
症状：数据量小的时候没问题，数据量一大就变慢。

原因：AI 默认生成的查询没有考虑索引和分页优化。

解决：对关键查询手动添加索引，使用分页查询避免全表扫描。

九、写在最后
13 天的开发经历让我对 AI 编程有了更深的理解：

AI 不是替代开发者，而是放大开发者的能力。一个有经验的开发者 + Trae Solo，可以做到以前一个小团队才能完成的事情。但前提是，你需要知道"做什么"和"怎么做"——架构设计、技术选型、业务理解，这些仍然是人类开发者的核心竞争力。

Trae Solo 最大的价值在于降低了"从想法到产品"的门槛。以前一个想法从构思到落地可能需要几个月，现在可能只需要两周。这种效率的提升，让独立开发者也能做出以前只有团队才能完成的项目。

如果你也在用 Trae Solo 开发项目，欢迎交流经验！
本文参与 Trae Solo 挑战赛，感谢阅读！如果觉得有帮助，欢迎点赞收藏

用户18 · 2026 年5 月 10 日 15:02

1-12weishakongzhe ?