1. 摘要
假期刚过,发现SOLO做了比较大的更新:windows用户可以下载PC端、增加了定时任务的功能、还可以自己选择模型。于是我尝试使用 TRAE SOLO自动化,搭建了一套自动化的"每日 AI 全球新闻情报工作流",实现 8 路并行采集、信源可追溯、时间锁定验证,彻底解决了新闻"AI 幻觉"和"信源无法验证"的痛点。
2. 背景
看到更新后的solo有预置了新闻采集的简报,但是尝试了一下,默认的每日简报模板,并不能满足个人对新闻及时性的需求,存在下面的一些问题:
- 信息源少、方向单一
- 信源不清、混杂个人自媒体转述内容
- 及时性弱,新闻消息过时老旧
我于是我想:能不能基于这个自动化任务进行改造,更可靠的新闻采集方式
3. 实践过程
3.1 任务拆解
我把整个工作流拆解成 4 个阶段:
- 阶段1:初始化时间窗口和任务列表
- 阶段2:7 路并行采集(国内、海外、学术、开源、社区、X 平台、融资活动)
- 阶段3:清洗、验证、时间锁定
- 阶段4:生成结构化报告
3.2 使用的 SOLO 能力
| 能力 | 应用场景 |
|---|---|
general_purpose_task |
8 路并行子代理采集 |
websearch |
检索指定来源的新闻 |
TodoWrite |
追踪任务进度 |
Write |
生成原始数据文件和最终报告 |
| 时间计算 | 精确 24 小时时间窗口 |
3.3 关键 Prompt / 操作过程
第一步:初始化时间窗口
获取当前时间 T0(UTC+8)→ 计算 T1 = T0 - 24 小时 → 时间窗口 [T1, T0]
创建 5 个任务(Task-01 到 Task-05)并标记 pending
标记 Task-01 为 completed
目的
-
明确时间基准:严格定义新闻的 24 小时窗口
[T1, T0],为后续所有时间过滤提供唯一、可追溯的锚点。 -
建立任务追踪:五个任务状态(01~05)全程可视化,避免跳步或遗漏。Task-01 完成即宣告初始化结束,确保工作流有序启动。
第二步:8路并行采集
每个渠道使用 general_purpose_task + websearch:
# Sub-China 采集指令
搜索中文科技媒体和大厂(阿里巴巴/通义、字节/豆包、腾讯/混元等)
关键词:"[公司名]" + AI OR 发布 OR 战略 OR 大模型
补充:机器之心、量子位、36氪
返回格式:title ||| time ||| url ||| summary ||| source ||| grade ||| category ||| tags ||| heat ||| verify_note
目的
-
信源全覆盖:同时抓取国内大厂、海外官媒、学术论文、开源项目、社区热点、关键人物、融资事件和国内活动,杜绝“信息茧房”。
-
效率与独立并行:8 路互不干扰,每路限定 6 条,防止单一渠道信息过载;活动路独立运行,避免与融资路混淆。
-
标准化采集:所有条目强制按
title ||| time ||| url ...格式输出,为后续清洗提供统一结构。 -
信源等级预标记:从源头标注 A/B/C 等级,为阶段 3 的交叉验证打下基础。
第三步:清洗验证
这是 核心防幻觉机制:
- 时间过滤:丢弃不在 [T1, T0] 窗口内的条目
- 信源验证:C 级信源必须交叉验证 A 级来源
- 去重:同一事件保留最高等级信源条目
- 时间锁定表:建立时间戳的唯一数据源
第四步:生成报告
按固定格式输出:
Lead → Key Metrics → Top Stories → Notable Mentions → Conference & Events
目的
-
消除幻觉的最后屏障:所有数据强制从候选项和时间锁定表读取,禁止重新生成、凭记忆补写,确保每个事实都经过阶段 3 的验证。
-
格式纪律:输出只包含指定日报结构,不包含任何摘要、分析或过程中间产物,防止一份报告出现多个版本。
-
流程闭环:Task-05 完成标志着整个工作流可审计地结束,每一次运行都产生唯一、确定的结果
3.4 踩坑与解决
坑点 1:时区混乱
- 问题:最开始时间没指定 UTC+8,导致采集偏差
- 解决:强制使用
TZ=Asia/Shanghai获取时间
坑点 2:信源等级误判
- 问题:部分中文媒体转载被误认为原创
- 解决:增加"铁律":海外事件必须追溯至原始英文来源,中文媒体转载一律不采
坑点 3:URL 幻觉
- 问题:模型曾经"编造"了一个不存在的 URL
- 解决:增加 URL 可访问性验证,无法确认即丢弃
坑点 4:任务执行中断,敏感词
- 问题:经常提示词做好了,执行不了
- 解决:重新调整提示词
4. 成果展示
最终输出的是一份 完全结构化的 Markdown 新闻报告,包含:
核心功能
8 路并行采集,覆盖 30+ 信源
信源分级体系(A/B/C),重要新闻全部 A 级来源
时间锁定验证,杜绝"旧闻新炒"
标准化字段:标题、时间、URL、摘要、来源、等级、分类、标签、热度、验证备注
示例报告:
SOLO 的角色
在这个工作流中,SOLO 不只是"代码生成器",而是全流程的编排者:
- 将复杂的采集任务拆解为 8 个并行子代理
- 通过 Todo 系统自动追踪和管理进度
- 通过 Write 生成标准化报告
可复用方法论
“8-3-1” 防幻觉新闻采集法:
- 8 路采集:确保信息多样性
- 3 级验证:时间 + 信源 + 事实
- 1 表锁定:时间锁定表是唯一数据源
这套方法论可以迁移到任何需要信息收集的领域:财经新闻、行业动态、竞品监控等。
个人思考
所谓的"AI 幻觉",本质上是缺乏验证机制。只要把信源可追溯、交叉验证设计进工作流,AI 就能成为最可靠的助手。
因为偷懒只想用一个文档解决,如果拆成多子文件以及添加调用工具应该能更简洁
觉得有帮助的话,点个赞支持一下~
收藏这篇帖子的同时,也欢迎分享给需要信息收集的朋友!





















