非专业新闻编辑，用 SOLO 自动化任务搭建全球 AI 情报监控系统

硬气一点 · 2026 年5 月 6 日 11:50

1. 摘要

假期刚过，发现SOLO做了比较大的更新：windows用户可以下载PC端、增加了定时任务的功能、还可以自己选择模型。于是我尝试使用 TRAE SOLO自动化，搭建了一套自动化的"每日 AI 全球新闻情报工作流"，实现 8 路并行采集、信源可追溯、时间锁定验证，彻底解决了新闻"AI 幻觉"和"信源无法验证"的痛点。

2. 背景

看到更新后的solo有预置了新闻采集的简报，但是尝试了一下，默认的每日简报模板，并不能满足个人对新闻及时性的需求，存在下面的一些问题：

信息源少、方向单一
信源不清、混杂个人自媒体转述内容
及时性弱，新闻消息过时老旧

我于是我想：能不能基于这个自动化任务进行改造，更可靠的新闻采集方式

3. 实践过程

3.1 任务拆解

我把整个工作流拆解成 4 个阶段：

阶段1：初始化时间窗口和任务列表
阶段2：7 路并行采集（国内、海外、学术、开源、社区、X 平台、融资活动）
阶段3：清洗、验证、时间锁定
阶段4：生成结构化报告

3.2 使用的 SOLO 能力

能力	应用场景
`general_purpose_task`	8 路并行子代理采集
`websearch`	检索指定来源的新闻
`TodoWrite`	追踪任务进度
`Write`	生成原始数据文件和最终报告
时间计算	精确 24 小时时间窗口

3.3 关键 Prompt / 操作过程

第一步：初始化时间窗口

获取当前时间 T0（UTC+8）→ 计算 T1 = T0 - 24 小时 → 时间窗口 [T1, T0]
创建 5 个任务（Task-01 到 Task-05）并标记 pending
标记 Task-01 为 completed

目的

明确时间基准：严格定义新闻的 24 小时窗口 [T1, T0]，为后续所有时间过滤提供唯一、可追溯的锚点。
建立任务追踪：五个任务状态（01~05）全程可视化，避免跳步或遗漏。Task-01 完成即宣告初始化结束，确保工作流有序启动。

第二步：8路并行采集

每个渠道使用 general_purpose_task + websearch：

# Sub-China 采集指令
搜索中文科技媒体和大厂（阿里巴巴/通义、字节/豆包、腾讯/混元等）
关键词："[公司名]" + AI OR 发布 OR 战略 OR 大模型
补充：机器之心、量子位、36氪
返回格式：title ||| time ||| url ||| summary ||| source ||| grade ||| category ||| tags ||| heat ||| verify_note

image2506×1221 445 KB

image2506×1187 261 KB

image1400×1176 73.1 KB

image2262×1283 307 KB

image2171×958 419 KB

image2205×1070 300 KB

目的

信源全覆盖：同时抓取国内大厂、海外官媒、学术论文、开源项目、社区热点、关键人物、融资事件和国内活动，杜绝“信息茧房”。
效率与独立并行：8 路互不干扰，每路限定 6 条，防止单一渠道信息过载；活动路独立运行，避免与融资路混淆。
标准化采集：所有条目强制按 title ||| time ||| url ... 格式输出，为后续清洗提供统一结构。
信源等级预标记：从源头标注 A/B/C 等级，为阶段 3 的交叉验证打下基础。

第三步：清洗验证

这是 核心防幻觉机制：

时间过滤：丢弃不在 [T1, T0] 窗口内的条目
信源验证：C 级信源必须交叉验证 A 级来源
去重：同一事件保留最高等级信源条目
时间锁定表：建立时间戳的唯一数据源

deepseek_mermaid_20260506_78ea941920×7269 450 KB

image1400×1176 69.6 KB

image2214×1266 356 KB

第四步：生成报告

按固定格式输出：

Lead → Key Metrics → Top Stories → Notable Mentions → Conference & Events

image398×1323 38 KB

image1400×1176 69.5 KB

image1622×1338 216 KB

image2862×1351 477 KB

目的

消除幻觉的最后屏障：所有数据强制从候选项和时间锁定表读取，禁止重新生成、凭记忆补写，确保每个事实都经过阶段 3 的验证。
格式纪律：输出只包含指定日报结构，不包含任何摘要、分析或过程中间产物，防止一份报告出现多个版本。
流程闭环：Task-05 完成标志着整个工作流可审计地结束，每一次运行都产生唯一、确定的结果

3.4 踩坑与解决

坑点 1：时区混乱

问题：最开始时间没指定 UTC+8，导致采集偏差
解决：强制使用 TZ=Asia/Shanghai 获取时间

坑点 2：信源等级误判

问题：部分中文媒体转载被误认为原创
解决：增加"铁律"：海外事件必须追溯至原始英文来源，中文媒体转载一律不采

坑点 3：URL 幻觉

问题：模型曾经"编造"了一个不存在的 URL
解决：增加 URL 可访问性验证，无法确认即丢弃

坑点 4：任务执行中断，敏感词

问题：经常提示词做好了，执行不了
解决：重新调整提示词

4. 成果展示

最终输出的是一份 完全结构化的 Markdown 新闻报告，包含：

核心功能

8 路并行采集，覆盖 30+ 信源
信源分级体系（A/B/C），重要新闻全部 A 级来源
时间锁定验证，杜绝"旧闻新炒"
标准化字段：标题、时间、URL、摘要、来源、等级、分类、标签、热度、验证备注

示例报告：

SOLO 的角色

在这个工作流中，SOLO 不只是"代码生成器"，而是全流程的编排者：

将复杂的采集任务拆解为 8 个并行子代理
通过 Todo 系统自动追踪和管理进度
通过 Write 生成标准化报告

可复用方法论

“8-3-1” 防幻觉新闻采集法：

8 路采集：确保信息多样性
3 级验证：时间 + 信源 + 事实
1 表锁定：时间锁定表是唯一数据源

这套方法论可以迁移到任何需要信息收集的领域：财经新闻、行业动态、竞品监控等。

个人思考

所谓的"AI 幻觉"，本质上是缺乏验证机制。只要把信源可追溯、交叉验证设计进工作流，AI 就能成为最可靠的助手。

因为偷懒只想用一个文档解决，如果拆成多子文件以及添加调用工具应该能更简洁

觉得有帮助的话，点个赞支持一下~

收藏这篇帖子的同时，也欢迎分享给需要信息收集的朋友！