【Code With SOLO】听见植物:把孩子的一瞬好奇,变成会说话的成长记录

1. 摘要

我用 TRAE SOLO 做了一个面向儿童的植物收录 Web App 「听见植物」:孩子只要“拍一下”,30 秒内即可完成“识别→确认→收录”全流程(朗读提示 + 语音感想 + 待整理任务卡引导整理,离线也可回看)。
本作品的 MVP 在成都 TRAE 活动 Workshop 中首次完成,并获得「城市最佳作品奖」,随后一周持续迭代打磨。
开发主要使用 Code with SOLO;而需求澄清 / MVP 范围确定 / 技术选型以及本帖的数据整理与撰写MTC 辅助完成。


2. 背景

我是一名前端开发,也是一位妈妈。带娃在户外时,孩子经常捡起一片叶子、观察一朵花,认真地给“新朋友”取名字,然后抬头问我:“妈妈,它叫什么?”
但很多时候我们当场也说不出答案——现有识别工具大多面向成人,操作复杂、信息过载;我还得反复打开豆包拍照识别再解释一遍,而且通用识别在植物场景下准确度也不够稳定。

所以我想做一个更适合孩子的方式:步骤更少、关键提示可朗读、孩子自己就能完成“识别—记录—整理—回看”。我也希望孩子不只是知道“它叫什么”,而是能在时间里反复遇见同一株植物,记录四季变化,把一瞬的好奇变成一段被珍藏的成长记忆。


3. 实践过程(用 SOLO 的过程与数据复盘)

3.1 我是怎么拆解任务的

为了在 Workshop 的时间压力下先做出 MVP、再用一周把它迭代到可用,我把「听见植物」拆成 3 条主线并行推进:

  1. 儿童主流程闭环(必须跑通):拍照/选图 → 识别 → 确认 → 录音 → 收录
  2. 儿童可独立使用的交互:全程可听(朗读/TTS)+ 大按钮 + 防误触
  3. 真实场景的“中断续做”:引入“待整理任务卡”,把补完流程做成小任务

对应过程截图线索:

3.2 我用了 SOLO 的哪些能力

  • 需求澄清与范围收敛:把“想法”压到可交付的 MVP,并规划 Roadmap
  • 技术选型与方案对比:识别服务选择、是否需要大模型、隐私与密钥策略
  • 视觉设计到开发的闭环:先用 SOLO 生成视觉设计规范文档(色彩/字体/插画与贴纸风格/组件与间距等 UI 规则),再调用 Pencil MCP 自动生成设计稿;后续通过 Prompt 对设计稿进行多轮迭代,并让前端代码按设计稿逐页对齐
  • 前后端开发与问题定位:围绕相机唤起、页面导航、返回逻辑、待整理闭环等问题快速迭代
  • 文档与复盘沉淀:把临时讨论逐步固化为可复用的产品/技术文档与操作清单




solo修改pencil设计稿视频
通过网盘分享的文件:solo调教pencil.mp4
链接: 百度网盘 请输入提取码 提取码: cv1f

3.3 关键 Prompt / 操作过程(摘取代表性片段)

以下为我在过程里反复使用的几类“推动项目向前”的关键提问:

  1. 需求与目标(把场景讲清楚)

    • “我快 5 岁的孩子喜欢植物……想做一款电子标本集:拍照识别、按时间季节归类、还能录感想……”
  2. 技术路线(把选型定下来)

    • “技术栈 React,云识别你有什么推荐?”
    • “不需要用到 AI 大模型吗?”
    • “你能再给我讲下推荐的百度吗?我对这块不了解”
  3. 产品与交互(把儿童友好做实)

    • “你不做一个原型设计?”
    • “玩具/绘本感”
    • “先生成设计规范文档,再用 Pencil MCP 出设计稿;然后边评审边迭代,让代码对齐设计稿”
  4. 工程化落地(把上线与安全兜住)

    • “前端目前有用 Netlify,后端不知道如何部署”
    • “你更能接受哪种托管方式?(会影响后端如何处理百度密钥)”

四个关键主题的推进轨迹(按天)

数据源:这张图直接用 按天(MM-DD) 的方式展示,并用关键词把每条 prompt 归到“UI/相机上传/待整理与路由/本地预览/设计交付/部署”等主题,从而还原“这几天主要在推进什么”。
说明:这里用日期做横坐标,是为了让读者直观看到推进强弱;真正的“在做什么”,需要结合主题曲线与截图一起看。

我刻意只保留 4 个最能代表推进过程的主题(UI、相机上传、待整理/路由状态、本地预览)。结合曲线的波峰波谷,可以读到一个更贴近真实开发的节奏:

  1. 先把“环境 + 采集入口”打通:在前两天(04-10~04-11)本地预览/启动与相机上传上升,说明我优先把“能在设备上跑起来、能拍/能选图”解决掉
  2. 中段进入“按设计稿对齐”的高强度打磨:中间几天 UI 对齐上升,同时待整理/路由状态也逐步抬头——代表“像素级对齐 + 流程闭环”并行推进
  3. 临近交付再集中补齐整理闭环:在 04-17 附近,待整理/路由状态与相机上传再次抬升——更符合“把真实使用时的中断与回访整理补齐到可交付”的收尾工作

3.4 中间踩过什么坑(以及怎么解决的)

  • “能跑”不等于“孩子能用”:最大返工来自按钮误触、流程中断、返回路径混乱 → 用“待整理任务卡 + 明确回落路径”做闭环
  • 相机/相册唤起与导航细节:移动端对 input/camera、返回键、页面跳转非常敏感 → 用截图对照逐页修正
  • 隐私与密钥风险:识别服务的 Key 绝不能出现在前端 → 走后端代理 + 环境变量,避免泄露

4. 成果展示

4.1 产品截图


4.2 项目链接

4.3 PWA 安装与更新方法

「听见植物」支持以 PWA(像 App 一样)安装到手机桌面。

安装

  • iPhone/iPad(Safari):扫描二维码 → 分享按钮 → 添加到主屏幕
  • Android(Chrome):扫描二维码 → 右上角菜单 → 安装应用 / 添加到主屏幕

更新

  • 一般情况下:关闭 App → 重新打开,即会自动拉取最新版本
  • 如果发现样式/功能仍是旧的:在页面内执行一次下拉刷新/刷新;仍不行再彻底退出后重开
  • 仍无法更新(少见):删除已安装的 PWA 后重新安装(等同于清空旧缓存)

5. 效果与总结

5.1 最终效果(作品层面)

5.2 数据洞察(推进过程与卡点)

  • 8 天 / 1403 条 交互记录:覆盖需求澄清、设计对齐、工程排查、上线方案等完整过程

下面几张图用于把“推进过程”“精力分配”和“卡点”讲清楚:

图|Prompt 主题占比(推断,细化后)


解读(回答“主要精力花在哪”)
可以看到占比靠前的并不是“写业务逻辑”,而是更贴近真实交付的几类工作:

  • UI 设计/动效/对齐:大量迭代发生在“儿童能不能看懂、敢不敢点、点了反馈够不够明确”这类体验问题上
  • 开发启动/本地预览(含跨设备):移动端预览/摄像头/跨设备访问是典型时间黑洞
  • 待整理任务卡/路由状态:围绕中断续做、返回路径、流程闭环的反复打磨
  • 资源/图片/文件引用:说明过程里频繁用截图/设计稿/文件对齐细节,而不是只靠文字描述

图|卡点主题 Top10(连续重复段≥3 次数,细化后)


解读:同一主题被连续追问/修正,通常就是推进卡点。它可能来自 prompt 信息不足(缺少可复现步骤/上下文),也可能来自 AI coding 在某些工程细节上需要多轮试错(相机权限、路由状态、移动端兼容等)。

图|推进强度与复杂度(按天;条数 vs 主题数)

解读:这张图是按天(MM-DD)展示的,所以柱子的起伏代表“哪一天沟通/迭代更集中”。我一般这样读它:

  • 条数高 + 主题数也高:交叉问题集中爆发(多条主线互相影响),需要回到“最小可复现 + 逐个击破”,并及时沉淀规则/清单
  • 条数高 + 主题数不高:大概率是单一难题(例如跨设备预览/权限/路由状态)在反复攻坚
  • 条数不高 + 主题数高:更多是收尾阶段的分散修补与查漏补缺

图|Prompt 主题词云(Top 50)

解读:词云用更直观的方式补充说明“我到底在反复讨论什么”。你会看到关键词集中在 设计/按钮/拍照/识别/整理/返回/列表/录音 等,整体指向同一个目标:把产品从“能跑”打磨到“孩子能顺畅用完一次流程”。

5.3 SOLO 在我流程里做了什么(我觉得最有价值的 3 点)

  1. 帮我把模糊想法收敛成可交付的 MVP:明确主链路与优先级,先交付再迭代
  2. 帮我把“视觉设计 → 设计稿 → 代码对齐”跑成闭环:规范先行,设计稿可迭代,代码按稿对齐
  3. 帮我在卡点处快速定位与复盘:把问题拆成可复现步骤,边修边沉淀成文档与清单

5.4 可复用的方法(给同样想“用 AI 做出可交付作品”的人)

  • 先用截图对齐,再写 Prompt:截图能极大降低歧义,比“描述 UI”更稳定
  • 遇到卡点就换成“最小可复现”Prompt:环境、步骤、预期、实际、日志(必要时)一次给齐
  • 把“中断续做/草稿箱”当成标配:越是多步骤流程越需要它,产品才会从“能演示”变成“能真实用”
  • 多轮纠偏后要“对齐文档”,降低噪声:迭代过程中会产生大量临时结论与分叉方案;每次纠偏后,把最终选择写回到 1-2 份“唯一可信文档”(PRD/流程/视觉规范/部署说明等),避免团队(或自己)被历史噪声带偏
  • 临近交付一定要做文档收口:把过程材料整理成清晰目录(README + docs 导航),把“怎么跑/怎么部署/关键取舍/已知问题”写明白,方便后续迭代时快速回到同一份共识、减少重复沟通与返工

5.5 普适价值(这套思路不止用于识花)

  • 隐私敏感的媒体类记录(儿童/家庭/语音日记/随手记)适合 Local-First
  • 多步骤流程天然需要“待整理/任务卡/草稿箱”来兜住中断
  • 语音优先与无障碍适用于不识字儿童、老年人、以及需要边走边用的场景

确实挺不错了 下载下来用用

5 个赞

内容很干货

3 个赞

我下载看看。感觉挺好的

2 个赞

认识大自然的好工具,高效、准确、便捷!

2 个赞

不错,支持下

3 个赞

可以.特别好

3 个赞

不错,支持下。

3 个赞

想点赞不知道在哪,写在评论里吧,:+1:

3 个赞

真不错呀, 感觉也适合 Hello AI 科技致善 赛道

1 个赞

效果真是强

2 个赞

昨天上榜大屏了,就是 Hello AI 科技致善 赛道

1 个赞

谢谢您的青睐

1 个赞

后面会增加服务器数据库或者支持宝藏本导出导入功能

1 个赞

博主非常有新意!赞!

2 个赞

nice好东西,收藏

2 个赞

这两天用了用,确实还不错

2 个赞

看着挺好的

2 个赞

我靠,这太牛了,想法和做出来的都厉害

1 个赞

谢谢亲的认可 :waving_hand: