产品建议:优化 Solo 语音讨论与工具模块联动功能
初步使用了 Solo 的一些基本功能,对于语音讨论这个功能的思路非常棒,是一个亮点。但是目前这个功能空有躯壳,没有灵魂,智能体的智力不足,容易受上下文限制而卡住,需要重开对话讨论。也有可能是语音识别对长时间沉默会断连或者超时处理,需要结束语音,重新打开语音讨论。
补充:经过简单测试,好像对话时长是15分钟左右
一、当前痛点
1. 功能模块割裂
语音讨论与 MTC、Code 模块无法直接联动,全部对话后形成讨论结果
2. 外部信息接入受限
无法直接调取外部网页、读取或上传本地参考资料,只能靠口述传递内容,导致讨论脱离实际参考依据、传递效率低且易出现理解偏差。
3. 智能体与语音识别存在局限
智能体易受上下文限制而卡住,语音识别在长时间沉默后会断连且没有自动唤醒功能,需要重新开启对话。
4. 暂不支持多角色协作讨论
当前仅支持单人使用,无法满足团队多人同时参与讨论的场景需求。
二、优化建议
1. 语音助手作为总 Agent 统一调度(重点)
将语音助手作为总 Agent,统一调度 MTC 和 Code 模块,支持根据对话上下文“按照指令”智能调用对应工具,实现跨模块协同。
2. 支持文档预处理
在讨论过程中直接完成文档的整理和预处理,无需切换工具。
3. 支持代码 Demo 自动生成
根据讨论内容自动生成代码 Demo 示例,快速验证思路。
4. 支持外部素材接入
- 支持直接粘贴网页链接,自动抓取并解析内容
- 支持上传 PDF、Word 等本地文档作为参考素材
- 支持上传图片,便于结合视觉内容进行讨论
5. 优化语音识别机制
增加自动唤醒功能,避免长时间沉默断连后需要重新开启对话的情况。
6. 支持多角色协作讨论
支持多人同时加入语音讨论,满足团队协作需求。
三、预期效果
- 省去手动整理环节,减少重复操作,让沟通与工具执行无缝衔接
- 让讨论能结合具体真实素材,梳理出的方案更贴合实际工作场景
- 大幅提升团队协作效率和整体使用体验