【Code With SOLO】相册截图堆到爆?0基础文科生睡前用 SOLO Mobile 做了个整理神器

【Code With SOLO】0 基础文科生睡前用 SOLO Mobile 盘活了积灰截图




1. 摘要

大家刷手机娱乐的过程中,经常会截图保存一些感想、选题、想买的东西、对话、教程等等。但因为这些截图并不急迫,也不属于某个明确任务,所以它们经常会被闲置在相册里,然后就忘记启发过自己的事。

所以最近刷手机的时候,我就想:能不能用 SOLO Mobile 做一个基于手机端的截图整理工具,让截图自动上传给大模型解析,提取关键信息,再沉淀到备忘录或文档里。这样以后我偶尔想起来,也真的能翻回去看,而不是截图完就结束了。

2. 背景

本人本科读的是广告,研究生还是新传,可以说是 0 代码基础。之前在一家卖 API 的公司做过一年半海外运营实习,所以对大模型、API 和 agent 有一点点了解。

在开始做这个工具之前,我的前置信息大概是:

  1. 了解大模型基本不能在本地部署,需要通过 API 连接。
  2. 了解很多接入需要 MCP 或 CLI 的方式,如果要连接手机终端,还需要了解手机厂商或系统的设置。
  3. 知道可以把服务部署在云端,这样就可以避开电脑必须常开的情况。

3. 实践过程

3.1 初始想法

我的初始指令是这样的:

我想做一个基于苹果手机的快捷指令,就是我截图之后可以自动上传截图内容通过大模型解析然后把内容沉淀到备忘录或者 Obsidian 里。
比如说我截图了一个对话,可能意味着我之后要看这个对话作为待办;有些我截图是告诉我之后要尝试某个东西。
你先思考下怎么设计 mcp-builder mcp-builder,你先做一个计划,思考一下要怎么实现 react-native-skills react-native-skills。

3.2 用到的 SOLO 能力

这次主要利用了 TRAE SOLO 的 skill 能力。整体来说,它的流程还是比较完整的,后面也做了安全检查。我一开始不是直接让它写完整项目,而是先让它做计划、拆解实现路径,然后再一点点改需求。后面的修改基本都围绕几个问题展开:

中间我问过很多类似这样的问题:

关于收集下来的分类意图可能不能硬性设计,要根据大模型,还是说我设计一个输入框?

我们先不考虑和其他软件的互通,Obsidian 可以的或者是备忘录。

可以沉淀到一个文档吗?每次新开一个太多了。

3.3 中间最折磨的部分

比较折磨的是快捷指令流程。

快捷指令里有些步骤需要手动输入,但不了解官方开发文档,导致字段名、请求方式、上传逻辑经常有问题。

还有就是网络问题。

虽然我知道云端部署可以解决电脑不能常开的问题,但一开始给我的方案是用 Mac 本地 IP,手机端一直显示连接超时。后来换成云端,又一直显示连接中断。

中间我真的反复问了很多遍,差不多是这种状态:

这样吗?

还是显示网络连接中断。

又显示超时了。

网络连接中断了?

还是显示网络连接中断。

不是上传到 Cloudflare 了吗?

又显示请求超时。

我就是想走 cloud,然后就不需要同一个 Wi-Fi 了。

Cloudflare 会显示断网,本地ip显示请求超时,究竟怎么解决?

不要,我不可能做到手机电脑一直连一个 Wi-Fi。

显示网络连接已中断。

这个怎么改?

显示网络连接已中断。

就这样问了一百遍。

这里我感受比较明显的是:SOLO 在生成方案和推进项目上很方便,但遇到网络、部署、快捷指令这种跨环境问题时,如果前面的错误方案已经进入上下文,它有时候会反复把被验证过错误的方案再推回来。感觉 memory 还有待提高。

但我后来也发现,可能是因为我当时没有开 GLM-5.1,而是用了 auto,所以模型能力也有影响。

3.4 调试经验

这次还有一个很重要的感受:测试脚本和日志真的很重要。如果有更清晰的测试脚本和日志,就能快速定位错误,而不是一直在“网络连接已中断”里循环。所以我很希望之后能有一个专门的 skill,帮助 0 代码用户做这类调试。(但可能已经有了只是我不了解)

还有我在和 Cloudflare authorize 的时候也一直不通过,最后只能手动加。这里也感觉,如果这些开发网站的 MCP / CLI 连接可以更方便一点,会非常适合 mobile 场景。