【SOLO三端实测】【实践案例】从工位到通勤,我用 SOLO 三端协同造了一个多 Agent 议事中间件

前言

TRAE SOLO 三端全量开放了——移动端、桌面端、网页端,加上语音交互和定时任务。作为一个日常重度使用 SOLO 的开发者,我决定用一个真实项目来深度体验三端协同到底能带来什么改变。项目是 Agora,一个多 Agent 圆桌讨论中间件,让多个 AI Agent 围坐一桌进行结构化讨论。

一、桌面端 Code 模式:项目主战场

项目核心开发毫无疑问在桌面端完成。Agora 后端 2000+ 行 Python、50+ 个 API 端点、4 个前端页面,全部由 SOLO Code 模式驱动。

1.1 从零到骨架:一次对话搞定

打开桌面端,直接描述需求:

“帮我搭建一个基于 FastAPI 的多 Agent 议事中间件,支持创建房间、Agent 注册、轮流发言、SSE 实时推送,带 Web UI”

SOLO 一次性生成了完整的项目骨架——FastAPI 应用、SQLite 数据库初始化、SSE 端点、4 个 HTML 页面,python agora.py 跑起来就能看到界面。这种"描述即产出"的体验在桌面端尤其高效,大屏幕+完整键盘让长 Prompt 输入和代码审查都很顺畅。

![桌面端开发截图](此处替换为桌面端 Code 模式开发截图)

1.2 迭代式开发:自然语言驱动的精准修改

项目开发中最大的感受是——SOLO 真的能理解架构意图。比如这个需求:

“提示词应该拆分,帮助页只教连接,注册时服务器返回角色专属提示词,避免每个 agent 读取全量提示词浪费上下文”

SOLO 理解这是一个架构级变更,自动完成了:

  • 后端新增 PRESET_ROLE_PROMPTSSPEAKER_GUIDERECORDER_GUIDE 三层模板
  • 修改注册接口返回 prompt 字段
  • 前端简化帮助页提示词为 2 步连接指引
  • 新增自定义角色提示词输入和编辑弹窗

跨 3 个文件、涉及后端+前端+数据库的修改,一次对话全部搞定。

1.3 Bug 诊断:比断点调试更快

开发中遇到一个诡异 Bug——房间页面进去后不显示任何内容。SOLO 分析了 loadRoom() 的执行流程,直接定位到:

document.getElementById('room-name').textContent = roomData.name;

这行代码设置了 h1textContent,但 h1 内部嵌套了 <span id="room-id-display">textContent 赋值会销毁所有子元素。后续 getElementById('room-id-display') 返回 null,TypeError 导致整个函数崩溃。SOLO 建议将房间名包裹在独立 <span> 中,一行改两行,问题解决。

这种 DOM 层面的隐蔽 Bug,人工排查可能要打断点跟半小时,SOLO 通过代码静态分析直接定位。

二、移动端:通勤时的远程指挥部

2.1 通勤场景:地铁上继续推进项目

早上通勤 40 分钟,以前只能刷手机摸鱼。现在打开 SOLO 移动端,可以继续推进 Agora 的开发。

实际体验:在地铁上发现自定义角色的删除按钮应该改成齿轮图标(点击进入编辑弹窗),直接在移动端输入需求:

“自定义角色那里把删除按钮改成齿轮图标,点击后进入二级弹窗,可以修改角色名称、头像、提示词”

移动端界面操作流畅,语音输入识别准确。SOLO 完成了修改后,回到工位打开桌面端,代码已经同步更新,直接继续开发。三端任务同步几乎是无缝的

移动端操作截图

2.2 语音下发任务:解放双手

移动端的语音输入是通勤场景的杀手级功能。走路时不想打字,直接语音描述需求:

“会议结束后角色还显示在线,应该把状态改成offline”

语音识别准确度不错,技术术语(offline、API、SSE)也能正确识别。响应速度和文字输入基本一致,没有明显延迟。对于碎片化时间利用来说,语音输入比打字效率高很多。

2.3 远程调度:离开工位也能掌控

午休时突然想到一个优化点——精炼按钮在记录员离线时应该给提示而不是没反应。不用跑回工位,手机上直接给 SOLO 下发任务。等回到电脑前,修改已经完成,测试通过。

这种"想到就改"的体验,以前需要记在备忘录里等回到电脑前再处理,现在随时随地就能推进。

三、语音交互:三端都能开口说话

3.1 桌面端语音:讨论架构方案

在 Agora 的架构设计阶段,我尝试用桌面端语音和 SOLO 讨论方案:

“我在考虑提示词系统要不要拆分,目前所有 agent 都读同一份全量提示词,但记录员专用部分对其他 agent 没用,还浪费上下文……”

语音对话的流畅度不错,SOLO 能理解长段语音中的关键信息。流式转录+字幕呈现让对话过程很清晰,不用担心听漏。最终讨论出了"帮助页只教连接,注册时返回角色专属提示词"的方案。

3.2 移动端语音:碎片化输入

移动端语音更适合短指令,比如"加个消息折叠功能"、“修复轮次不推进的 Bug”。识别速度快,适合通勤或走路时快速下达任务。

3.3 语音交互的体验感受

  • 识别准确度:中文技术场景下表现不错,API 名称、变量名等基本能正确识别
  • 流式转录:说话过程中就能看到文字,方便确认 SOLO 是否理解正确
  • 适用场景:架构讨论适合桌面端长对话,任务下发适合移动端短指令

四、定时任务:让 SOLO 自动巡检

4.1 配置体验

我给 Agora 项目配置了一个定时任务——每天早上自动检查代码质量:

  • 定时检查 agora.py 是否有语法错误
  • 自动运行 API 测试脚本验证端点可用性
  • 如果发现问题,生成报告保存到项目目录

配置过程很直观,设置 cron 表达式、填写任务描述即可。云端执行模式不需要本地电脑开机,很方便。

4.2 执行可靠性

几天的运行下来,定时任务执行稳定,没有出现漏执行或执行失败的情况。对于需要持续维护的项目来说,定时巡检+自动报告是一个很实用的功能组合。

五、三端协同的真实感受

5.1 任务同步

三端任务同步是这次体验中最让我惊喜的能力。移动端下发的任务,桌面端能看到完整的执行过程和结果;桌面端的代码修改,移动端也能查看。不是简单的消息同步,而是完整的工作上下文同步

5.2 场景切换

场景 使用端 典型操作
深度开发 桌面端 Code 模式 架构设计、大规模代码生成、Bug 修复
通勤碎片时间 移动端 语音下发小任务、查看执行结果
架构讨论 桌面端语音 长对话讨论方案、权衡取舍
快速指令 移动端语音 “加个XX功能”、“修复XX Bug”
自动巡检 定时任务 代码质量检查、API 可用性验证

5.3 Code 模式 vs MTC 模式

在 Agora 项目中,我主要使用 Code 模式——因为需要直接修改代码文件。MTC 模式更适合"给我调研一下 XX 技术"这类信息收集任务。两种模式各有擅长,Code 模式是开发主武器,MTC 模式是调研辅助。

六、总结与建议

实际提效

  • 开发效率:Agora 从零到开源发布,核心开发约 2 天,SOLO 承担了 90%+ 的编码工作
  • 碎片时间利用:移动端让通勤时间也能推进项目,每天多出约 40 分钟有效开发时间
  • 问题响应速度:语音+移动端让"想到就改"成为可能,不再需要等回到工位

SOLO 三端的价值

SOLO 三端不是简单的"同一个工具装了三次",而是针对不同场景的协同工作流

  • 桌面端是深度工作的主战场
  • 移动端是碎片时间的远程指挥部
  • 语音交互是解放双手的自然接口
  • 定时任务是无人值守的自动助手

改进建议

  1. 移动端代码审查:目前移动端查看代码变更稍显吃力,希望增加 diff 视图
  2. 语音连续对话:语音模式下希望能更方便地进行多轮对话,而不是每次重新开始
  3. 定时任务结果推送:希望定时任务执行结果能推送到移动端通知

:link: 项目地址: GitHub - moyu929/Agora: Agnet会议中间件 · GitHub

SOLO 让 AI 开发不再被绑在电脑前——从工位到通勤,从键盘到语音,AI 真正融入了每一个工作场景。

1 个赞