简介
Little G (小G) 是一个具备“眼睛”和“双手”能力的智能 Agent,能够通过视觉大模型理解屏幕内容,并自动执行鼠标键盘操作。
代码结构
-
src/gui_agent/vision_client.py: 眼睛 - 负责截屏和调用视觉模型。 -
src/gui_agent/action_executor.py: 双手 - 负责执行点击、输入等操作。 -
src/gui_agent/agent_core.py: 大脑 - 小G 的核心感知-决策-执行循环。 -
src/gui_agent/llm_provider.py: 模型接口 - 封装 OpenAI/Gemini/Kimi API。 -
src/gui_agent/skills/: 技能 - 小G 可以调用的扩展能力。
小G第一次完美完成我布置的任务纪念视频:7.64 06/15 m@d.nD Nwf:/ 3月5日 (1) 我和Trae一起搓的GUIagent,小G。# 我和Trae # 这也能开播 https://v.douyin.com/cedFvvizYpQ/ 复制此链接,打开Dou音搜索,直接观看视频!