前言
TRAE SOLO 三端全量开放了——移动端、桌面端、网页端,加上语音交互和定时任务。作为一个日常重度使用 SOLO 的开发者,我决定用一个真实项目来深度体验三端协同到底能带来什么改变。项目是 Agora,一个多 Agent 圆桌讨论中间件,让多个 AI Agent 围坐一桌进行结构化讨论。
一、桌面端 Code 模式:项目主战场
项目核心开发毫无疑问在桌面端完成。Agora 后端 2000+ 行 Python、50+ 个 API 端点、4 个前端页面,全部由 SOLO Code 模式驱动。
1.1 从零到骨架:一次对话搞定
打开桌面端,直接描述需求:
“帮我搭建一个基于 FastAPI 的多 Agent 议事中间件,支持创建房间、Agent 注册、轮流发言、SSE 实时推送,带 Web UI”
SOLO 一次性生成了完整的项目骨架——FastAPI 应用、SQLite 数据库初始化、SSE 端点、4 个 HTML 页面,python agora.py 跑起来就能看到界面。这种"描述即产出"的体验在桌面端尤其高效,大屏幕+完整键盘让长 Prompt 输入和代码审查都很顺畅。

1.2 迭代式开发:自然语言驱动的精准修改
项目开发中最大的感受是——SOLO 真的能理解架构意图。比如这个需求:
“提示词应该拆分,帮助页只教连接,注册时服务器返回角色专属提示词,避免每个 agent 读取全量提示词浪费上下文”
SOLO 理解这是一个架构级变更,自动完成了:
- 后端新增
PRESET_ROLE_PROMPTS、SPEAKER_GUIDE、RECORDER_GUIDE三层模板 - 修改注册接口返回
prompt字段 - 前端简化帮助页提示词为 2 步连接指引
- 新增自定义角色提示词输入和编辑弹窗
跨 3 个文件、涉及后端+前端+数据库的修改,一次对话全部搞定。
1.3 Bug 诊断:比断点调试更快
开发中遇到一个诡异 Bug——房间页面进去后不显示任何内容。SOLO 分析了 loadRoom() 的执行流程,直接定位到:
document.getElementById('room-name').textContent = roomData.name;
这行代码设置了 h1 的 textContent,但 h1 内部嵌套了 <span id="room-id-display">,textContent 赋值会销毁所有子元素。后续 getElementById('room-id-display') 返回 null,TypeError 导致整个函数崩溃。SOLO 建议将房间名包裹在独立 <span> 中,一行改两行,问题解决。
这种 DOM 层面的隐蔽 Bug,人工排查可能要打断点跟半小时,SOLO 通过代码静态分析直接定位。
二、移动端:通勤时的远程指挥部
2.1 通勤场景:地铁上继续推进项目
早上通勤 40 分钟,以前只能刷手机摸鱼。现在打开 SOLO 移动端,可以继续推进 Agora 的开发。
实际体验:在地铁上发现自定义角色的删除按钮应该改成齿轮图标(点击进入编辑弹窗),直接在移动端输入需求:
“自定义角色那里把删除按钮改成齿轮图标,点击后进入二级弹窗,可以修改角色名称、头像、提示词”
移动端界面操作流畅,语音输入识别准确。SOLO 完成了修改后,回到工位打开桌面端,代码已经同步更新,直接继续开发。三端任务同步几乎是无缝的。
2.2 语音下发任务:解放双手
移动端的语音输入是通勤场景的杀手级功能。走路时不想打字,直接语音描述需求:
“会议结束后角色还显示在线,应该把状态改成offline”
语音识别准确度不错,技术术语(offline、API、SSE)也能正确识别。响应速度和文字输入基本一致,没有明显延迟。对于碎片化时间利用来说,语音输入比打字效率高很多。
2.3 远程调度:离开工位也能掌控
午休时突然想到一个优化点——精炼按钮在记录员离线时应该给提示而不是没反应。不用跑回工位,手机上直接给 SOLO 下发任务。等回到电脑前,修改已经完成,测试通过。
这种"想到就改"的体验,以前需要记在备忘录里等回到电脑前再处理,现在随时随地就能推进。
三、语音交互:三端都能开口说话
3.1 桌面端语音:讨论架构方案
在 Agora 的架构设计阶段,我尝试用桌面端语音和 SOLO 讨论方案:
“我在考虑提示词系统要不要拆分,目前所有 agent 都读同一份全量提示词,但记录员专用部分对其他 agent 没用,还浪费上下文……”
语音对话的流畅度不错,SOLO 能理解长段语音中的关键信息。流式转录+字幕呈现让对话过程很清晰,不用担心听漏。最终讨论出了"帮助页只教连接,注册时返回角色专属提示词"的方案。
3.2 移动端语音:碎片化输入
移动端语音更适合短指令,比如"加个消息折叠功能"、“修复轮次不推进的 Bug”。识别速度快,适合通勤或走路时快速下达任务。
3.3 语音交互的体验感受
- 识别准确度:中文技术场景下表现不错,API 名称、变量名等基本能正确识别
- 流式转录:说话过程中就能看到文字,方便确认 SOLO 是否理解正确
- 适用场景:架构讨论适合桌面端长对话,任务下发适合移动端短指令
四、定时任务:让 SOLO 自动巡检
4.1 配置体验
我给 Agora 项目配置了一个定时任务——每天早上自动检查代码质量:
- 定时检查
agora.py是否有语法错误 - 自动运行 API 测试脚本验证端点可用性
- 如果发现问题,生成报告保存到项目目录
配置过程很直观,设置 cron 表达式、填写任务描述即可。云端执行模式不需要本地电脑开机,很方便。
4.2 执行可靠性
几天的运行下来,定时任务执行稳定,没有出现漏执行或执行失败的情况。对于需要持续维护的项目来说,定时巡检+自动报告是一个很实用的功能组合。
五、三端协同的真实感受
5.1 任务同步
三端任务同步是这次体验中最让我惊喜的能力。移动端下发的任务,桌面端能看到完整的执行过程和结果;桌面端的代码修改,移动端也能查看。不是简单的消息同步,而是完整的工作上下文同步。
5.2 场景切换
| 场景 | 使用端 | 典型操作 |
|---|---|---|
| 深度开发 | 桌面端 Code 模式 | 架构设计、大规模代码生成、Bug 修复 |
| 通勤碎片时间 | 移动端 | 语音下发小任务、查看执行结果 |
| 架构讨论 | 桌面端语音 | 长对话讨论方案、权衡取舍 |
| 快速指令 | 移动端语音 | “加个XX功能”、“修复XX Bug” |
| 自动巡检 | 定时任务 | 代码质量检查、API 可用性验证 |
5.3 Code 模式 vs MTC 模式
在 Agora 项目中,我主要使用 Code 模式——因为需要直接修改代码文件。MTC 模式更适合"给我调研一下 XX 技术"这类信息收集任务。两种模式各有擅长,Code 模式是开发主武器,MTC 模式是调研辅助。
六、总结与建议
实际提效
- 开发效率:Agora 从零到开源发布,核心开发约 2 天,SOLO 承担了 90%+ 的编码工作
- 碎片时间利用:移动端让通勤时间也能推进项目,每天多出约 40 分钟有效开发时间
- 问题响应速度:语音+移动端让"想到就改"成为可能,不再需要等回到工位
SOLO 三端的价值
SOLO 三端不是简单的"同一个工具装了三次",而是针对不同场景的协同工作流:
- 桌面端是深度工作的主战场
- 移动端是碎片时间的远程指挥部
- 语音交互是解放双手的自然接口
- 定时任务是无人值守的自动助手
改进建议
- 移动端代码审查:目前移动端查看代码变更稍显吃力,希望增加 diff 视图
- 语音连续对话:语音模式下希望能更方便地进行多轮对话,而不是每次重新开始
- 定时任务结果推送:希望定时任务执行结果能推送到移动端通知
项目地址: GitHub - moyu929/Agora: Agnet会议中间件 · GitHub
SOLO 让 AI 开发不再被绑在电脑前——从工位到通勤,从键盘到语音,AI 真正融入了每一个工作场景。