一句话总结:
我用 SOLO 把一个需要长期盯守的 AI4S 仿真实验,改造成了可以无人值守、远程查看、自动复盘的科研训练流水线。
我用 TRAE SOLO 搭建了一套 AI4S 科研仿真的无人值守训练工作流:从输入 round 训练任务,到自动启动 Docker 仿真环境,再到手机端、网页端实时查看训练日志,最后通过飞书接收关键节点提醒,并自动整理每天的训练过程,生成日报和周报。
1. 背景
我的工作和比赛场景比较特殊:白天需要处理正常工作,晚上还要参加 AI For Science 相关比赛,其中一个项目涉及托克马克控制仿真训练。
这个任务需要频繁启动实验模拟环境、运行 Docker、记录不同 round 的训练参数、观察训练是否中断,并整理每天的实验结果。
过去主要有几个问题:
- 每次训练前都要手动检查环境、启动容器、运行脚本;
- 训练过程较长,不能一直盯着 Mac 终端;
- 日志分散在终端、文件和聊天记录中,复盘困难;
- 到周报阶段,经常需要重新翻日志、补过程、整理实验结论;
- 白天上班、晚上训练,人工值守成本太高。
所以我希望用 SOLO 搭建一个科研训练自动化流程,把“部署环境、启动训练、远程查看、节点通知、日报周报”串成一条完整流水线。
2. 实践过程
我把整个任务拆成了 4 个部分。
第一步:输入 round 训练任务
我先把本轮训练任务,例如 round9 的训练目标、参数说明、脚本路径和输出要求输入给 SOLO。

SOLO 会根据任务内容识别本轮需要启动的训练脚本、Docker 环境、日志目录和输出文件。
这里的目标不是让 SOLO 简单写一段代码,而是让它先理解当前实验任务的上下文。
第二步:自动检查和部署实验模拟环境
SOLO 根据任务要求,自动检查本地实验环境,包括:
- Docker 是否可用;
- 仿真镜像是否存在;
- 训练脚本路径是否正确;
- 输出目录和日志目录是否准备好;
- 当前 round 是否和历史训练记录冲突;
- 是否需要重新启动仿真服务。
检查完成后,SOLO 会自动启动 Docker 仿真环境,进入训练流程。
这一步减少了大量重复性环境检查工作,也避免了因为路径、容器、日志目录问题导致训练中断。
第三步:无人值守运行训练
点击开始后,SOLO 自动部署训练流程,并启动托克马克仿真训练。
训练过程中,它会持续记录关键输出,包括:
- 当前 round;
- 训练是否正常运行;
- Docker 容器状态;
- 关键日志;
- 报错信息;
- 训练分数变化;
- 参数调整记录;
- 是否出现 early termination;
- 是否需要人工介入。
这样我不需要一直盯着终端,只需要在关键节点查看结果即可。
第四步:三端查看和飞书通知
训练启动后,我可以通过 Mac 端、手机端和网页端查看训练流程和输出。
同时,SOLO 会把关键训练节点同步到飞书端,例如:
- 训练开始;
- Docker 环境启动完成;
- 某个 round 运行完成;
- 出现异常报错;
- 当前训练结果摘要;
- 当天实验总结。
这样即使我不在电脑旁边,也能知道训练是否正常进行。
第五步:自动生成日报和周报
训练日志不再只是散落在终端里,而是会被 SOLO 自动整理成结构化记录。
每天结束后,SOLO 根据当天训练内容生成日报,包括:
- 今日运行了哪些 round;
- 使用了哪些关键参数;
- 训练是否成功;
- 得分或指标有什么变化;
- 出现了哪些问题;
- 明天需要继续尝试什么方向。
每周再把多天日报汇总成周报,包括:
- 本周完成的训练任务;
- 最有效的参数组合;
- 失败实验和原因;
- 当前最高分或关键指标;
- 下周优化计划。
这样科研仿真训练从“只跑代码”变成了“自动记录、自动复盘、持续优化”的工作流。
4. 成果展示
最终,我用 SOLO 形成了一套可复用的 AI4S 实验训练工作流:
- 一次输入训练任务,自动识别本轮 round 目标;
- 自动检查 Docker 和仿真环境;
- 自动启动托克马克模拟训练;
- 训练过程无需人工长时间值守;
- Mac 端、手机端、网页端可以查看训练进度;
- 飞书端自动推送关键训练节点;
- 每天自动整理训练日志,形成日报;
- 每周自动汇总实验进展、问题和下一步计划,形成周报。
这套流程的价值不只是节省时间,更重要的是让科研训练过程变得可追踪、可复盘、可复用。
对于 AI4S、数据建模、仿真训练这类长周期工作来说,SOLO 不只是一个代码生成工具,而是可以变成一个长期参与实验流程的 AI 工作助理。
5. 配图说明
本次作品主要展示 3 张图:
图 1:输入 round9 训练任务
展示我如何把本轮训练目标、参数和任务说明输入给 SOLO,让 SOLO 理解当前要执行的仿真实验。
图 2:点击开始后自动部署训练
展示 SOLO 自动检查环境、启动 Docker,并进入托克马克仿真训练流程。
图 3:三端查看和飞书通知
展示训练运行后,可以在 Mac 端、手机端、网页端查看训练状态,同时飞书端可以收到关键训练节点提醒。
如果后续继续完善,我还会增加一张日报/周报生成截图,用来展示 SOLO 对训练日志的自动整理能力。
6. 效果与总结
过去一次完整训练流程,通常需要我手动检查环境、启动脚本、盯日志、记录异常,最后再花时间整理实验进展。
现在通过 SOLO,我把这些操作压缩成了一个自动化流程。
最大的变化是:我不再只是“让 AI 写代码”,而是让 SOLO 参与到真实工作流中,成为一个科研训练助理。
它负责启动环境、记录过程、整理日志和生成复盘材料,我只需要关注实验策略、参数选择和结果判断。
这次实践让我感觉,SOLO 最适合的场景不是一次性生成代码,而是把复杂工作拆成连续动作:
- 部署环境;
- 运行任务;
- 监控状态;
- 推送节点;
- 沉淀文档;
- 自动复盘。
对于 AI4S、科研仿真、数据建模、长期调参这类工作,这种方式比单次问答更有价值。
这个流程主要解决了我在参加 AI For Science 比赛时的痛点:白天上班、晚上训练,无法长时间盯着终端和日志。通过 SOLO,我把原本需要人工反复操作和整理的流程,压缩成了“一次输入、持续训练、自动记录、定期复盘”的工作方式。
