【Code with SOLO】10分钟深度搜索抖音|找到 100可用的对标短视频

【Code with SOLO】10分钟找到任意行业 100可用的抖音对标短视频和文案

摘要

解决视频制作选题搜集问题和后续作品数据追踪问题。

于关键词、描述或视频在抖音深度搜索选题内容获取视频的表层数据、高赞评论和文稿提取;持续观察最新爆款和行业相关最新视频;追踪某个作者或团队内账号的作品

SOLO 制作一个前端页面,让同事能够可视化、更清晰便捷地查看 ai 在平台上搜索出来的内容。内置了一个 Agent,直接对采集的内容进行总结、分析甚至改写,形成全流程闭环。


背景

我是一个新媒体公司的运营,在 TRAE IDE 时期,我已经搓了一个可用的 skill(w-hand),支持:

  • 关键词/链接搜索:按关键词或视频链接搜索抖音/小红书内容
  • 获取信息:获取视频的表层数据和文稿提取
  • 追踪作者:追踪某个作者或团队的作品
  • 深度搜索:基于关键词、描述或视频,在抖音搜索相关选题内容,然后对搜索出来的结果进行进一步的分析,再搜索。可以自定义筛选符合的内容,排除不想要的内容(如筛选出剧情向内容,排除简单的营销广告)

本次升级目标(1~1.5)

让同事能够可视化、更清晰便捷地看到搜索出来的内容,以便后续的内容制作流程更加顺畅。具体来说:

  1. 前端界面:让非技术人员也能轻松使用
  2. 搭配 Agent:可以直接对采集的内容进行总结、分析甚至改写
  3. 全流程闭环:从选题采集到内容分析,一站式完成

实践过程

阶段1:项目初期准备(4/28)

第一件事情就是在 AGENTS.md 文件里增加了一条提示词,让 solo 把我做的每一个任务、每一件事情都要写进一个叫"开发过程记录.md" 的文档里,以便后续我可以直接通过这个文档让 Agent 写出你现在看到的这篇文章。甚至可以让SOLO在过程中自己截图,给后续整理文章的时候使用。

前期准备

  1. 安装 brainstorming skill:与 SOLO 一起脑暴项目方案。这是社区上爆火的一个叫 super power 的 skill,它会在真正开始做事情之前,跟你讨论好你要做的开发内容具体是什么,保证 Agent 在工作的时候往你想要的方向去实现。
  2. 增加 AGENTS.md 提示词:保证整个项目烹饪过程被完整记录
  3. 安装 webapp-testing skill:这个技能可以在 SOLO 左上角的技能仓库搜索到,它的作用就是可以自己操控浏览器来测试网页有哪些功能是不对的、不正常的,然后自己进行修改。

阶段2:前端开发(4/29-4/30)

脑暴设计方案

我的目标:设计一个可视化界面,让同事能方便查看对标视频的内容

我的做法:我使用 brainstorming skill 与 SOLO 一起脑暴,描述了我想到的核心功能(输入窗口、输出窗口、任务区分),然后我和 SOLO 最终通过 brainstorming 讨论出了整个前端的结构框架。

开发完成后,我使用 web testing 技能让 SOLO 进行自动化测试,它用自己操控网页的能力在开发和测试过程中大大降低了人的工作量:

图:Agent 正在由操作中 - 自动测试网页功能


升级到 Agent World 设计规范

一开始,SOLO直接做出来的前端实在是太丑了,完全没法看。我当时就在想,别的大佬是怎么做的呢?可能是用了某些技能,或者是自己接了审美比较哇塞的模型,或者是提前就准备好了一份设计规范文档提前准备好了对应的图片和视频素材?

虽然说这个东西是给自己人用的内部工具,但是我感觉还是要做得稍微顺眼一点,不能太敷衍:

  1. 准备设计规范文档:在扣子有一个官方给龙虾的交流社区,我想参考它的整体感觉来制作这个界面,所以这次我并没有给 SOLO 使用网上那些比较火的open design 之类的设计技能,而是直接给SOLO 一个参考网页,写了一个设计规范文档([AGENT_WORLD_DESIGN_GUIDE.md](file:///Users/peiminhuang/vibe_coding/w-hand-4-trae-solo/trae-train/AGENT_WORLD_DESIGN_GUIDE.md))
  2. 让 SOLO 基于这个设计规范重新设计前端
  3. 实现暖色调米色背景、衬线标题、大量留白的设计风格

界面效果对比

旧版本界面(SOLO 直接开干得出的结果)

新版本界面(根据SOLO 自己研究出的Agent World 设计规范重构)

使用技巧:

多个任务并行处理

在之前的前端制作完成后还会有一些bug,我在让它修bug的时候,就开了另一个任务,让他来分析网站,写这个设计规范文档。

多信息源让 SOLO 更懂你

单纯只是提供一条Agent World 网页链接并不能让 SOLO 获得网页的全部信息,后续我还把网页的全部内容保存到本地给 SOLO 并且让他自己截图进行图片分析(没图片时他把网页的点缀色认成了蓝色),这样他对整个要参考的网站才有了比较好的理解。


阶段3:Agent 集成(5/1-5/2)

原本以为只需要做一个前端界面展示搜索出来的数据文案和视频就好了,但是在实际中发现问题。之前一直用的是 TRAE IDE 本身就是一个 Agent,跟它对话就能使用我设计好的 skill,但制作了前端界面后,想让其他人直接使用,还得再集成一个 Agent。

猪猪侠拼装

:plus:

把三样东西拼装在一起:

  1. 已有的 skill:搜索技能(搜索、深度搜索等)
  2. 新做的前端:可视化界面
  3. Claude Agent SDK:AI 能力(使用的模型是 MiniMax 2.7)

拼装结果

在原有展示搜索结果的界面中增加了通过自然语言对话创建任务的能力,而且还能实时看到采集的进度和结果,对已经产出的内容和 ai 一起分析,后续还能整理成知识库


Agent 深度搜索演示

显示采摘结果(单次搜索出的视频默认 100 个)

详情页(采集评论的数量、视频点赞评论收藏转发的数量要求等都可以和 ai 交互来设置)

阶段4:优化迭代(5/3-5/4)

更多优化:

在手机上使用的时候,我还想让操作更简单一些。现在你可以用手指滑动来操作了:上下滑动可以切换不同的视频,左右滑动可以切换查看不同的信息(视频、数据、评论)。点击黑色的背景区域,还可以直接退出详情页,很方便。

最后,我还发现视频详情里显示的是视频标题,但我更想看的是视频里的文字内容。现在这个问题也解决了,你可以直接看到视频里的文字内容,不用再自己去看视频听了。

效果与总结

指标 之前 之后
选题准备时间 2-3天甚至一周 1 小时搞定,同一个工作台内实现搜集和整理。并且可以 24 小时不间断监测和搜集信息
团队使用 只有我自己能用 同事打开网页就能用,下班地铁上还可以鞭策他们继续干活
1 个赞

太强悍了牛

1 个赞