【Code-with-SOLO】solo 创建一个编程小白也可以快速上手的训练视觉模型项目YOLOStarter

1.摘要:

YOLOStarter 是一个专为代码小白和对视觉模型感兴趣的新手设计的 YOLO目标检测可视化平台。无需编写复杂代码,通过友好的图形界面即可完成从数据集准备、模型训练到实时预测的完整机器学习工作流。

2.背景:

本人是个高校学生,单独完成过企业视觉模型相关的项目,我在做项目的过程中,发现这这项目其实非常简单,但对方自身不会编程或者没时间编程,导致只能将其外包出去。故而我决定创建一个小白也能用的视觉模型训练平台。(ps:这个项目就是我从企业项目进行简化再简化的版本,也是用solo完成的)

3.实践过程:

创建项目之初,我就打算采用模块式项目,让每一个大模型可以最大效率的生成代码,比如:我会提前构思项目需要训练大模型模块,测试大模型模块,前端ui,存储服务等等,给这些任务每个分配一个模型让其去做。

当然过多模型同时生成需要一个标准化的Prompt比如“该模块需要具有可移植性,所有引用的路径都应是相对路径。”总有的模块会比较复杂,导致模型上下文越用越长,导致输出准确性降低,我采用每20轮对话新建一个对话,那两个对话怎么联系在一起呢?同样是Prompt,“在每次代码修改前或生成前创建一个文档,里面记录你的工作内容,以及本次代码修改哪些,完成了什么任务”。来保证对话与对话之间可以相互联系。

说实在话,和大模型对话不像和人类对话一样,你得把话讲得非常明白,非常清楚,不然容易出现模型幻觉(本人深受其扰),如果不知道怎么讲清楚,可以试试trae自带的优化内容功能,只要输入你的需求,就可以自动优化出来一个完整的提示词,亲测好用。

4.成果展示:

全代码已经开源(链接):https://github.com/yang493kjs/YOLOStarter.git

带有完整使用教程,和技术架构。从项目建立文件夹,到生成介绍文档,到上传github,全权由solo负责,本人未写过一行代码。

抖音视频链接:https://v.douyin.com/HsllC3g66-A/

5.效果与总结:

相比过去“古法编程”,ai大模型给程序员甚至普通人带来的是革命性的效率提升,可以让一个不会一点编程能力的普通人也可以做自己想要的东西。就我而言,我可以说是对代码的掌握程度很差,但是我依然可以快速的搭建出一个企业需要几个月才能搭建出来的系统,一个人负责前端,后端的完整项目。

我甚至可以在ai创建项目中学习到很多新东西,比如我会在搭建模块前先询问现在主流的框架是什么,使用什么新的技术栈等等。

有一说一,trae的免费使用模型给我这种普通大学生,带来了很大帮助,我几乎可以尽可能的发挥自己的想法,而不是被昂贵的价格限制。

1 个赞

这个是做什么的,有图像输入的录屏不

1 个赞

不错,学习了

1 个赞