GitHub:https://github.com/A-guage/3DPro/tree/main
一、摘要
我们利用 TRAE SOLO 搭建了**“元境智造”**——一个基于大模型协同的元宇宙场景自动化生成系统。用户只需输入自然语言描述(如"一个温馨的咖啡厅"),系统就能自动完成场景理解、智能规划、3D 模型生成和 Unreal Engine 场景组装的全流程。相比传统建模流程,实现了 6~9 倍的效率提升,将场景开发周期从"天级"压缩到"小时级"。
二、背景
我们的作品需要实现一个完整的 AI 驱动 3D 场景生成系统,涉及前端桌面应用、后端 AI 服务、3D 模型生成 API 集成、以及 Unreal Engine 自动化控制等多个技术领域。
面临的挑战:
技术栈复杂:需要同时掌握 Electron、React、FastAPI、MCP 协议、UE C++ 插件开发等多种技术
开发周期紧张:需要在有限时间内完成从架构设计到系统实现的完整开发
团队成员经验有限:部分技术领域是首次接触,学习成本高
系统集成难度大:前后端、AI 服务、3D 引擎之间需要高效协作
三、实践过程
3.1 任务拆解思路
我们将整个项目拆解为 四个核心模块,按依赖关系逐步推进:
用户交互层(Electron + React + Three.js)→ 桌面端界面与 3D 预览
Agent 服务层(FastAPI + DeepSeek + PiAgent)→ 场景理解与智能调度
工具层(混元 3D API + MCP 协议工具链)→ 模型生成与标准化工具调用
集成层(UE MCP 插件 + 模型数据库)→ UE 场景自动组装
3.2 使用 SOLO 的能力
在整个开发过程中,我们深度使用了 TRAE SOLO 的以下能力:
代码生成与补全:快速生成各模块的基础代码框架,包括 FastAPI 路由、React 组件、MCP Server 通信模块等
架构设计与技术选型:在项目初期,通过 SOLO 辅助完成四层架构设计和技术方案论证
Bug 修复与调试:在 MCP 通信延迟、模型格式兼容性等问题上,SOLO 帮助快速定位和解决问题
文档撰写:辅助完成 25 页的作品报告,包括技术方案、测试分析等章节
代码重构与优化:对关键模块进行性能优化,如并发控制、错误重试机制等
3.3 关键操作过程
Step 1:架构搭建 通过 SOLO 快速搭建项目骨架,包括 Electron 主进程/渲染进程架构、FastAPI 后端服务、以及 MCP Server 基础框架。
Step 2:核心模块开发
场景理解模块:利用 SOLO 设计多层次 Prompt Engineering 策略,让 DeepSeek 准确理解复杂场景描述并输出结构化 JSON 物体清单
MCP 通信模块:基于 SOLO 生成的 MCP Server 代码,实现与 UE C++ 插件的 TCP Socket 通信
PiAgent 调度模块:通过 SOLO 实现多智能体协同调度,包括任务分解、依赖管理、并行执行和错误恢复
Step 3:系统集成与测试
集成腾讯混元 3D API,实现文生 3D 模型的自动化流水线
开发 UE MCP 插件(C++),实现 34 个标准化工具覆盖 UE 完整工作流
完成端到端测试,验证从自然语言输入到 UE 场景输出的完整流程
3.4 踩过的坑
MCP 协议与 UE 通信延迟:初期 TCP 通信存在明显延迟,通过优化网络通信和引入心跳机制解决
3D 模型格式兼容性:AI 生成的模型格式与 UE 不完全兼容,实现了自动格式转换模块
大模型输出不稳定:DeepSeek 偶尔返回非标准格式,通过多次重试和结果验证机制保证稳定性
UE API 查找困难:UE 的 C++ API 庞大复杂,借助 SOLO 快速定位所需 API 并生成调用代码
四、成果展示
前端:
构建的场景:
4.1 系统架构
系统采用四层架构设计:用户交互层 → Agent 服务层 → 工具层 → 引擎集成层,各层通过 REST API 和 MCP 协议通信。
4.2 核心功能
自然语言场景理解:用户输入"一个温馨的咖啡厅",系统自动解析出桌子、椅子、咖啡机、灯具等物体清单
智能布局规划:基于 DeepSeek 的常识推理,自动规划物体尺寸、位置和空间关系
3D 模型自动生成:调用腾讯混元 3D API,并发生成多个高质量 3D 模型
UE 场景自动组装:通过 34 个 MCP 工具,自动完成模型导入、蓝图创建、场景布局
4.3 性能测试结果
测试项目 目标值 实测值 是否达标
场景理解响应时间 ≤3 秒 2.1 秒 ![]()
单个模型生成时间 ≤60 秒 45 秒 ![]()
场景组装时间 ≤5 分钟 3.5 分钟 ![]()
系统可用性 ≥99% 99.2% ![]()
4.4 效率对比
场景类型 传统流程 本系统 效率提升
简单室内场景(5个物体) 8 小时 1.2 小时 6.7 倍
中等办公场景(10个物体) 24 小时 3.5 小时 6.9 倍
复杂商业展厅(20个物体) 72 小时 8 小时 9.0 倍
4.5 用户测试反馈
评估维度 评分(1-5) 评价
易用性 4.5 操作简单,几乎无需学习
场景质量 3.8 生成质量达到中等水平
布局合理性 4.0 大部分场景布局合理
整体满意度 4.2 能够满足大部分需求
推荐意愿 4.5 愿意向同事推荐
五、效果与总结
提效成果
开发效率:借助 SOLO,团队在有限时间内完成了涉及 5+ 技术栈的复杂系统开发,代码生成和调试效率提升显著
场景生成效率:系统实现 6~9 倍的场景构建效率提升,将传统"天级"流程压缩至"小时级"
SOLO 在流程中的角色
SOLO 在我们的开发流程中扮演了全能开发助手的角色——从架构设计、代码生成、Bug 修复到文档撰写,覆盖了开发全生命周期。特别是在处理 MCP 协议通信、UE API 调用等我们不熟悉的领域时,SOLO 大幅降低了学习成本和开发门槛。
可复用的方法
分层架构 + 标准化协议:四层架构设计使各模块可独立开发和测试,MCP 协议实现了工具调用的标准化
多模型协同:DeepSeek 负责理解与规划,混元 3D 负责生成,各取所长
AI 辅助全流程开发:利用 SOLO 进行代码生成、调试和文档撰写,显著提升团队整体产出
未来展望
提升生成模型质量,优化 Prompt 和后处理流程
支持更多游戏引擎(如 Unity)
增加场景编辑功能,支持用户微调
探索多模态交互(图片、视频输入)

