【Code With SOLO】用 SOLO 搭建 AI4S 无人值守仿真训练环境,并自动生成日报周报

一句话总结:

我用 SOLO 把一个需要长期盯守的 AI4S 仿真实验,改造成了可以无人值守、远程查看、自动复盘的科研训练流水线。
我用 TRAE SOLO 搭建了一套 AI4S 科研仿真的无人值守训练工作流:从输入 round 训练任务,到自动启动 Docker 仿真环境,再到手机端、网页端实时查看训练日志,最后通过飞书接收关键节点提醒,并自动整理每天的训练过程,生成日报和周报。


1. 背景

我的工作和比赛场景比较特殊:白天需要处理正常工作,晚上还要参加 AI For Science 相关比赛,其中一个项目涉及托克马克控制仿真训练。

这个任务需要频繁启动实验模拟环境、运行 Docker、记录不同 round 的训练参数、观察训练是否中断,并整理每天的实验结果。

过去主要有几个问题:

  1. 每次训练前都要手动检查环境、启动容器、运行脚本;
  2. 训练过程较长,不能一直盯着 Mac 终端;
  3. 日志分散在终端、文件和聊天记录中,复盘困难;
  4. 到周报阶段,经常需要重新翻日志、补过程、整理实验结论;
  5. 白天上班、晚上训练,人工值守成本太高。

所以我希望用 SOLO 搭建一个科研训练自动化流程,把“部署环境、启动训练、远程查看、节点通知、日报周报”串成一条完整流水线。


2. 实践过程

我把整个任务拆成了 4 个部分。

第一步:输入 round 训练任务

我先把本轮训练任务,例如 round9 的训练目标、参数说明、脚本路径和输出要求输入给 SOLO。
2

SOLO 会根据任务内容识别本轮需要启动的训练脚本、Docker 环境、日志目录和输出文件。

这里的目标不是让 SOLO 简单写一段代码,而是让它先理解当前实验任务的上下文。


第二步:自动检查和部署实验模拟环境

SOLO 根据任务要求,自动检查本地实验环境,包括:

  • Docker 是否可用;
  • 仿真镜像是否存在;
  • 训练脚本路径是否正确;
  • 输出目录和日志目录是否准备好;
  • 当前 round 是否和历史训练记录冲突;
  • 是否需要重新启动仿真服务。

检查完成后,SOLO 会自动启动 Docker 仿真环境,进入训练流程。

这一步减少了大量重复性环境检查工作,也避免了因为路径、容器、日志目录问题导致训练中断。


第三步:无人值守运行训练

点击开始后,SOLO 自动部署训练流程,并启动托克马克仿真训练。

训练过程中,它会持续记录关键输出,包括:

  • 当前 round;
  • 训练是否正常运行;
  • Docker 容器状态;
  • 关键日志;
  • 报错信息;
  • 训练分数变化;
  • 参数调整记录;
  • 是否出现 early termination;
  • 是否需要人工介入。

这样我不需要一直盯着终端,只需要在关键节点查看结果即可。


第四步:三端查看和飞书通知

训练启动后,我可以通过 Mac 端、手机端和网页端查看训练流程和输出。

同时,SOLO 会把关键训练节点同步到飞书端,例如:

  • 训练开始;
  • Docker 环境启动完成;
  • 某个 round 运行完成;
  • 出现异常报错;
  • 当前训练结果摘要;
  • 当天实验总结。

这样即使我不在电脑旁边,也能知道训练是否正常进行。


第五步:自动生成日报和周报

训练日志不再只是散落在终端里,而是会被 SOLO 自动整理成结构化记录。

每天结束后,SOLO 根据当天训练内容生成日报,包括:

  • 今日运行了哪些 round;
  • 使用了哪些关键参数;
  • 训练是否成功;
  • 得分或指标有什么变化;
  • 出现了哪些问题;
  • 明天需要继续尝试什么方向。

每周再把多天日报汇总成周报,包括:

  • 本周完成的训练任务;
  • 最有效的参数组合;
  • 失败实验和原因;
  • 当前最高分或关键指标;
  • 下周优化计划。

这样科研仿真训练从“只跑代码”变成了“自动记录、自动复盘、持续优化”的工作流。


4. 成果展示

最终,我用 SOLO 形成了一套可复用的 AI4S 实验训练工作流:

  • 一次输入训练任务,自动识别本轮 round 目标;
  • 自动检查 Docker 和仿真环境;
  • 自动启动托克马克模拟训练;
  • 训练过程无需人工长时间值守;
  • Mac 端、手机端、网页端可以查看训练进度;
  • 飞书端自动推送关键训练节点;
  • 每天自动整理训练日志,形成日报;
  • 每周自动汇总实验进展、问题和下一步计划,形成周报。

这套流程的价值不只是节省时间,更重要的是让科研训练过程变得可追踪、可复盘、可复用。

对于 AI4S、数据建模、仿真训练这类长周期工作来说,SOLO 不只是一个代码生成工具,而是可以变成一个长期参与实验流程的 AI 工作助理。


5. 配图说明

本次作品主要展示 3 张图:

图 1:输入 round9 训练任务

展示我如何把本轮训练目标、参数和任务说明输入给 SOLO,让 SOLO 理解当前要执行的仿真实验。

图 2:点击开始后自动部署训练

展示 SOLO 自动检查环境、启动 Docker,并进入托克马克仿真训练流程。

图 3:三端查看和飞书通知

展示训练运行后,可以在 Mac 端、手机端、网页端查看训练状态,同时飞书端可以收到关键训练节点提醒。

如果后续继续完善,我还会增加一张日报/周报生成截图,用来展示 SOLO 对训练日志的自动整理能力。


6. 效果与总结

过去一次完整训练流程,通常需要我手动检查环境、启动脚本、盯日志、记录异常,最后再花时间整理实验进展。

现在通过 SOLO,我把这些操作压缩成了一个自动化流程。

最大的变化是:我不再只是“让 AI 写代码”,而是让 SOLO 参与到真实工作流中,成为一个科研训练助理。

它负责启动环境、记录过程、整理日志和生成复盘材料,我只需要关注实验策略、参数选择和结果判断。

这次实践让我感觉,SOLO 最适合的场景不是一次性生成代码,而是把复杂工作拆成连续动作:

  • 部署环境;
  • 运行任务;
  • 监控状态;
  • 推送节点;
  • 沉淀文档;
  • 自动复盘。

对于 AI4S、科研仿真、数据建模、长期调参这类工作,这种方式比单次问答更有价值。

这个流程主要解决了我在参加 AI For Science 比赛时的痛点:白天上班、晚上训练,无法长时间盯着终端和日志。通过 SOLO,我把原本需要人工反复操作和整理的流程,压缩成了“一次输入、持续训练、自动记录、定期复盘”的工作方式。