非专业新闻编辑,用 SOLO 自动化任务搭建全球 AI 情报监控系统

1. 摘要

假期刚过,发现SOLO做了比较大的更新:windows用户可以下载PC端、增加了定时任务的功能、还可以自己选择模型。于是我尝试使用 TRAE SOLO自动化,搭建了一套自动化的"每日 AI 全球新闻情报工作流",实现 8 路并行采集信源可追溯时间锁定验证,彻底解决了新闻"AI 幻觉"和"信源无法验证"的痛点。


2. 背景

看到更新后的solo有预置了新闻采集的简报,但是尝试了一下,默认的每日简报模板,并不能满足个人对新闻及时性的需求,存在下面的一些问题:

  1. 信息源少、方向单一
  2. 信源不清、混杂个人自媒体转述内容
  3. 及时性弱,新闻消息过时老旧

我于是我想:能不能基于这个自动化任务进行改造,更可靠的新闻采集方式


3. 实践过程

3.1 任务拆解

我把整个工作流拆解成 4 个阶段:

  • 阶段1:初始化时间窗口和任务列表
  • 阶段2:7 路并行采集(国内、海外、学术、开源、社区、X 平台、融资活动)
  • 阶段3:清洗、验证、时间锁定
  • 阶段4:生成结构化报告

3.2 使用的 SOLO 能力

能力 应用场景
general_purpose_task 8 路并行子代理采集
websearch 检索指定来源的新闻
TodoWrite 追踪任务进度
Write 生成原始数据文件和最终报告
时间计算 精确 24 小时时间窗口

3.3 关键 Prompt / 操作过程

第一步:初始化时间窗口

获取当前时间 T0(UTC+8)→ 计算 T1 = T0 - 24 小时 → 时间窗口 [T1, T0]
创建 5 个任务(Task-01 到 Task-05)并标记 pending
标记 Task-01 为 completed

目的

  • 明确时间基准:严格定义新闻的 24 小时窗口 [T1, T0],为后续所有时间过滤提供唯一、可追溯的锚点。

  • 建立任务追踪:五个任务状态(01~05)全程可视化,避免跳步或遗漏。Task-01 完成即宣告初始化结束,确保工作流有序启动。

第二步:8路并行采集

每个渠道使用 general_purpose_task + websearch

# Sub-China 采集指令
搜索中文科技媒体和大厂(阿里巴巴/通义、字节/豆包、腾讯/混元等)
关键词:"[公司名]" + AI OR 发布 OR 战略 OR 大模型
补充:机器之心、量子位、36氪
返回格式:title ||| time ||| url ||| summary ||| source ||| grade ||| category ||| tags ||| heat ||| verify_note

目的

  • 信源全覆盖:同时抓取国内大厂、海外官媒、学术论文、开源项目、社区热点、关键人物、融资事件和国内活动,杜绝“信息茧房”。

  • 效率与独立并行:8 路互不干扰,每路限定 6 条,防止单一渠道信息过载;活动路独立运行,避免与融资路混淆。

  • 标准化采集:所有条目强制按 title ||| time ||| url ... 格式输出,为后续清洗提供统一结构。

  • 信源等级预标记:从源头标注 A/B/C 等级,为阶段 3 的交叉验证打下基础。

第三步:清洗验证

这是 核心防幻觉机制

  • 时间过滤:丢弃不在 [T1, T0] 窗口内的条目
  • 信源验证:C 级信源必须交叉验证 A 级来源
  • 去重:同一事件保留最高等级信源条目
  • 时间锁定表:建立时间戳的唯一数据源

第四步:生成报告

按固定格式输出:

Lead → Key Metrics → Top Stories → Notable Mentions → Conference & Events

目的

  • 消除幻觉的最后屏障:所有数据强制从候选项和时间锁定表读取,禁止重新生成、凭记忆补写,确保每个事实都经过阶段 3 的验证。

  • 格式纪律:输出只包含指定日报结构,不包含任何摘要、分析或过程中间产物,防止一份报告出现多个版本。

  • 流程闭环:Task-05 完成标志着整个工作流可审计地结束,每一次运行都产生唯一、确定的结果

3.4 踩坑与解决

坑点 1:时区混乱

  • 问题:最开始时间没指定 UTC+8,导致采集偏差
  • 解决:强制使用 TZ=Asia/Shanghai 获取时间

坑点 2:信源等级误判

  • 问题:部分中文媒体转载被误认为原创
  • 解决:增加"铁律":海外事件必须追溯至原始英文来源,中文媒体转载一律不采

坑点 3:URL 幻觉

  • 问题:模型曾经"编造"了一个不存在的 URL
  • 解决:增加 URL 可访问性验证,无法确认即丢弃

坑点 4:任务执行中断,敏感词

  • 问题:经常提示词做好了,执行不了
  • 解决:重新调整提示词


4. 成果展示

最终输出的是一份 完全结构化的 Markdown 新闻报告,包含:

:bar_chart: 核心功能

  • :white_check_mark:8 路并行采集,覆盖 30+ 信源
  • :white_check_mark: 信源分级体系(A/B/C),重要新闻全部 A 级来源
  • :white_check_mark: 时间锁定验证,杜绝"旧闻新炒"
  • :white_check_mark: 标准化字段:标题、时间、URL、摘要、来源、等级、分类、标签、热度、验证备注

:link: 示例报告


:bullseye: SOLO 的角色

在这个工作流中,SOLO 不只是"代码生成器",而是全流程的编排者

  • 将复杂的采集任务拆解为 8 个并行子代理
  • 通过 Todo 系统自动追踪和管理进度
  • 通过 Write 生成标准化报告

:memo: 可复用方法论

“8-3-1” 防幻觉新闻采集法

  • 8 路采集:确保信息多样性
  • 3 级验证:时间 + 信源 + 事实
  • 1 表锁定:时间锁定表是唯一数据源

这套方法论可以迁移到任何需要信息收集的领域:财经新闻、行业动态、竞品监控等。

:light_bulb: 个人思考

所谓的"AI 幻觉",本质上是缺乏验证机制。只要把信源可追溯、交叉验证设计进工作流,AI 就能成为最可靠的助手。

因为偷懒只想用一个文档解决,如果拆成多子文件以及添加调用工具应该能更简洁


:heart: 觉得有帮助的话,点个赞支持一下~

:bookmark: 收藏这篇帖子的同时,也欢迎分享给需要信息收集的朋友!

1 个赞