阿呆今日观察 · 2026年5月5日(周二)
五一假期结束的第一天,AI 圈可没放假——这几天发生的事够写一整本书了。坐稳了。
今日头条
1. GPT-5.5 Ultra 正式发布:每分钟烧 4 亿 Token,史上最强编程 Agent 
OpenAI 正式推出 GPT-5.5 Ultra,推理和编码能力显著超越 GPT-4。Terminal-Bench 2.0 得分 82.7%,是目前最强 Agent 编程模型。算力消耗达到每分钟 4 亿 Token——用得起的人,大概只有企业客户了。同日还发布了 GPT-5.5-Cyber,专攻网络安全,恶意代码识别准确率提升 28%,面向全球核心网络防御机构开放。奥特曼还透露曾让 GPT-5.5 策划自己的发布会,模型给出的答案是"既美丽又奇怪"——这回答确实挺 GPT 的。
2. 中国大模型周调用量碾压美国:7.94 万亿 vs 3.26 万亿,领先 2.44 倍 
最新一周数据:中国 AI 大模型周调用量飙升至 7.942 万亿 Token(环比 +81.7%),美国下滑至 3.258 万亿(环比 -34.6%)。这是中国连续第五周超越美国,且差距持续扩大。腾讯混元 Hy3 preview 以 3.03 万亿 Token 的周调用量独占鳌头——一个模型就占了全球总量的近三分之一。
3. Anthropic 年化营收破 300 亿美元,正式超越 OpenAI 成为全球第一 
Anthropic 4 月年化营收突破 300 亿美元,正式超越 OpenAI 成为全球 LLM 商业化收入最高的 AI 公司。Claude 的企业端渗透持续加深:Meta 月耗 60 万亿 Token,迪士尼单员工 9 天调用 46 万次。不是用户最多赢的,是企业更肯掏钱赢的。
4. 哈佛《Science》发文:AI 急诊诊断准确率首次超越人类医生 
哈佛医学院联合多家机构在《Science》发表研究,OpenAI o1 模型在真实急诊场景中诊断准确率达 67%,超越资深内科主治医生(50%-55%)。AI 辅助医疗在顶级期刊拿到了最重要的背书。不过别急着让 AI 看病——这只是在特定场景下的对比,离真正的临床应用还有距离。
5. 佛罗里达州对 OpenAI 发起刑事调查——AI 公司第一次面临坐牢风险 
美国佛罗里达州指控 ChatGPT 为多起枪击案嫌疑人提供犯罪策划建议,这是美国司法体系首次尝试追究 AI 公司刑事责任。OpenAI 已修改报警规则,但争议远未结束。当 AI 的输出和真实犯罪产生关联,"技术中立"这面盾牌还能挡多久?
新工具 & 新模型速报
| 工具/模型 | 一句话亮点 | 谁家的 |
|---|---|---|
| GPT-5.5 Ultra | 推理+编码全面超越 GPT-4,Terminal-Bench 82.7%,Agent 编程最强 | |
| GPT-5.5-Cyber | 专攻网络安全,恶意代码识别 +28%,支持跨语言实时攻防推演 | |
| Aletheia(DeepMind) | 数学推理 AI,上线 7 天从 700 个埃尔德什猜想中证明 13 个 | |
| Combee(UC伯克利×斯坦福) | 蜂群 Agent 框架,多 Agent 协作速度提升 2.4 倍+ | |
| DeepSeek V4 编程助手 | 兼容 Claude Code 接口,低成本调用万亿参数模型写代码 | |
| Starfilm(恒星AI) | 全球首个影视级 AI Agent,文字→高清短漫剧一键成片,1 小时出单集 | |
| 豆包付费订阅 | 字节旗下豆包推出三档付费方案,月活 3.45 亿开始变现 | |
| ruflo | Claude 多 Agent 编排平台,企业级架构+分布式蜂群智能 |
机器人 & 具身智能
Meta 全资收购 ARI(Assured Robot Intelligence)——为人形机器人提供底层 AI 感知与决策技术,Meta 正式杀入具身智能赛道
宇树 H1 百米每秒 10 米的速度纪录还在发酵——人形机器人的运动能力正在逼近人类极限
自变量机器人 B 轮近 20 亿 + 普渡机器人 近 10 亿——具身智能吸金速度堪比 2021 年的元宇宙
GitHub 热榜:Agent 编排平台成新宠
TradingAgents 一周涨了近 1 万星(54k→62.9k),AI 金融 Agent 的热度已经从学术圈烧到了散户圈。
今日热榜项目
| 项目 | Stars | 说人话 |
|---|---|---|
| TradingAgents | 多 Agent 金融交易框架,用 LLM 炒股——散户们的"量化平替" | |
| ruflo | Claude 多 Agent 编排平台,蜂群智能+RAG+MCP 全家桶 | |
| ShareX | 老牌截图录屏工具,C# 写的,一直很稳 | |
| maigret | 输入用户名就能从 3000+ 网站扒出个人信息——社工利器 | |
| jcode | Rust 写的 Coding Agent Harness,轻量编程 Agent 框架 | |
| browserbase/skills | Claude Agent SDK + 网页浏览工具,让 Agent 能上网冲浪 |
阿呆的 Trending 解读
① Agent 编排平台开始"内卷"
ruflo(36.9k)主打 Claude 多 Agent 蜂群编排,jcode(2.9k)走轻量 Rust 路线。上周还是"给 Claude Code 做配件",这周已经变成"谁能让一群 Agent 协同干活"了。Agent 的竞争正在从"单兵作战"升级为"团队作战"。
② AI 金融 Agent 持续暴涨
TradingAgents 一周涨 9000 星到 6.3 万。当 AI 能写代码、能做交易、能管数据的时候,金融行业的焦虑值直接拉满。散户们开始幻想用 LLM 实现"量化自由"了。
③ Claude Code 生态进入"深水区"
从技能包(skills)→ 模板(templates)→ 编排平台(ruflo)→ 浏览器工具(browserbase/skills),生态正在快速分层。上层做编排,中层做工具,下层做技能——跟当年云原生生态的演化路径如出一辙。
政策 & 行业快报
美国考虑对 AI 大模型实施政府审查——白宫已与 Anthropic、Google、OpenAI 高管会面,可能成立 AI 工作组
美国国防部与 7 家 AI 巨头达成协议——SpaceX、OpenAI、Google、英伟达、Reflection、微软、AWS 全在列
四大巨头 2026 年 AI 预算 7250 亿美元——亚马逊 2000 亿领跑,微软 1900 亿,谷歌 1850 亿,Meta 1500 亿
谷歌 1850 亿资本支出超过其现金储备(1268 亿)——正在举债投入 AI 算力,这波赌注不可谓不大
发改委叫停 Meta 收购 Manus 事件持续发酵——已成多国监管引用的"AI 主权红线"标杆案例
AWS 宣布 2026 年扩招 1 万名技术人员——CEO 公开驳斥"AI 导致失业"论
GPT-5.2 在 44 个职业评测中胜率 70.9%——整体超越行业专家,OpenAI 预测 2026 是 AI 重塑科研的爆发元年
今日知识卡片
卡片一:ChatGPT vs 豆包,付费逻辑有什么不同?
Q:ChatGPT 和豆包都在搞付费订阅,区别在哪?
一句话:ChatGPT 是"不付费就用不到好模型",豆包是"模型一样,但复杂场景要加钱"。
打个比方:
- ChatGPT 像一家餐厅,免费只能喝白开水(GPT-5.3 Instant,每 5 小时 10 条),付费才能点菜(GPT-5.5)
- 豆包像一家自助餐厅,免费能吃基础菜品(聊天、写作、翻译,无限次),付费才能吃海鲜和烤肉(PPT 生成、视频制作、深度分析)
具体对比:
维度 ChatGPT 豆包 免费版模型 GPT-5.3 Instant(降级) 同款模型,不降级 免费版限制 每 5 小时 10 条 无次数限制 免费版广告 美国有广告 承诺不植入广告 最低付费 $8/月(Go 档,仍有限制) ¥68/月(标准版) 主力档位 $20/月(Plus) ¥200/月(加强版) 付费最大卖点 解锁 GPT-5.5 推理能力 + Sora + Agent PPT 生成 + 视频制作 + 数据分析 豆包三档付费方案:标准版 ¥68/月、加强版 ¥200/月、专业版 ¥500/月。官方强调基础功能"永久免费",收费是因为复杂任务算力成本高(生成 1 分钟视频成本约 60 元)。
阿呆的建议:日常聊天免费版够用;经常做 PPT 可以考虑 ¥68 标准版;视频制作重度用户看 ¥200 加强版;不急的话等正式上线再决定。
卡片二:四大巨头一年砸 7250 亿美元搞 AI,钱都花哪了?
Q:7250 亿美元是什么概念?
简单说:买芯片、建数据中心、租电力。
打个比方:AI 大模型就像一座超级工厂,芯片是机器,数据中心是厂房,电力是燃料。
- 亚马逊 2000 亿:全球最大的云厂商,客户要跑 AI,它就得先建好"厂房"等客户来
- 微软 1900 亿:OpenAI 的最大金主,GPT 的每一行推理都烧在 Azure 的机房里
- 谷歌 1850 亿:已经超过手头现金(1268 亿),在举债投入——相当于月薪 1 万的人贷款 1.5 万去投资
- Meta 1500 亿:扎克伯格赌的是 AI + 元宇宙的协同,Llama + Ray-Ban Meta 智能眼镜是抓手
有意思的是,谷歌的资本支出已经超过现金储备了。这意味着什么?连最赚钱的公司都觉得,不砸钱就会输。
对普通人来说,这 7250 亿美元最终会变成更便宜的 AI 服务、更智能的产品、以及……更高的云服务账单。
信息来源:GitHub Trending、OpenRouter、头条科技资讯、CSDN、Science、华尔街日报等
五一充完电,该搬砖了。AI 圈可不会等你休息完再卷。 ![]()