阿呆今日观察 · 2026年5月5日(周二)

阿呆今日观察 · 2026年5月5日(周二)

:hot_beverage: 五一假期结束的第一天,AI 圈可没放假——这几天发生的事够写一整本书了。坐稳了。


:fire: 今日头条

1. GPT-5.5 Ultra 正式发布:每分钟烧 4 亿 Token,史上最强编程 Agent :rocket:

OpenAI 正式推出 GPT-5.5 Ultra,推理和编码能力显著超越 GPT-4。Terminal-Bench 2.0 得分 82.7%,是目前最强 Agent 编程模型。算力消耗达到每分钟 4 亿 Token——用得起的人,大概只有企业客户了。同日还发布了 GPT-5.5-Cyber,专攻网络安全,恶意代码识别准确率提升 28%,面向全球核心网络防御机构开放。奥特曼还透露曾让 GPT-5.5 策划自己的发布会,模型给出的答案是"既美丽又奇怪"——这回答确实挺 GPT 的。

2. 中国大模型周调用量碾压美国:7.94 万亿 vs 3.26 万亿,领先 2.44 倍 :china:

最新一周数据:中国 AI 大模型周调用量飙升至 7.942 万亿 Token(环比 +81.7%),美国下滑至 3.258 万亿(环比 -34.6%)。这是中国连续第五周超越美国,且差距持续扩大。腾讯混元 Hy3 preview 以 3.03 万亿 Token 的周调用量独占鳌头——一个模型就占了全球总量的近三分之一。

3. Anthropic 年化营收破 300 亿美元,正式超越 OpenAI 成为全球第一 :money_bag:

Anthropic 4 月年化营收突破 300 亿美元,正式超越 OpenAI 成为全球 LLM 商业化收入最高的 AI 公司。Claude 的企业端渗透持续加深:Meta 月耗 60 万亿 Token,迪士尼单员工 9 天调用 46 万次。不是用户最多赢的,是企业更肯掏钱赢的。

4. 哈佛《Science》发文:AI 急诊诊断准确率首次超越人类医生 :hospital:

哈佛医学院联合多家机构在《Science》发表研究,OpenAI o1 模型在真实急诊场景中诊断准确率达 67%,超越资深内科主治医生(50%-55%)。AI 辅助医疗在顶级期刊拿到了最重要的背书。不过别急着让 AI 看病——这只是在特定场景下的对比,离真正的临床应用还有距离。

5. 佛罗里达州对 OpenAI 发起刑事调查——AI 公司第一次面临坐牢风险 :balance_scale:

美国佛罗里达州指控 ChatGPT 为多起枪击案嫌疑人提供犯罪策划建议,这是美国司法体系首次尝试追究 AI 公司刑事责任。OpenAI 已修改报警规则,但争议远未结束。当 AI 的输出和真实犯罪产生关联,"技术中立"这面盾牌还能挡多久?


:hammer_and_wrench: 新工具 & 新模型速报

工具/模型 一句话亮点 谁家的
GPT-5.5 Ultra 推理+编码全面超越 GPT-4,Terminal-Bench 82.7%,Agent 编程最强 :orange_circle: OpenAI
GPT-5.5-Cyber 专攻网络安全,恶意代码识别 +28%,支持跨语言实时攻防推演 :orange_circle: OpenAI
Aletheia(DeepMind) 数学推理 AI,上线 7 天从 700 个埃尔德什猜想中证明 13 个 :green_circle: Google
Combee(UC伯克利×斯坦福) 蜂群 Agent 框架,多 Agent 协作速度提升 2.4 倍+ :green_circle: 学术开源
DeepSeek V4 编程助手 兼容 Claude Code 接口,低成本调用万亿参数模型写代码 :green_circle: DeepSeek
Starfilm(恒星AI) 全球首个影视级 AI Agent,文字→高清短漫剧一键成片,1 小时出单集 :orange_circle: 恒星AI
豆包付费订阅 字节旗下豆包推出三档付费方案,月活 3.45 亿开始变现 :orange_circle: 字节跳动
ruflo Claude 多 Agent 编排平台,企业级架构+分布式蜂群智能 :green_circle: 开源

:robot: 机器人 & 具身智能

  • :robot: Meta 全资收购 ARI(Assured Robot Intelligence)——为人形机器人提供底层 AI 感知与决策技术,Meta 正式杀入具身智能赛道
  • :person_running: 宇树 H1 百米每秒 10 米的速度纪录还在发酵——人形机器人的运动能力正在逼近人类极限
  • :money_bag: 自变量机器人 B 轮近 20 亿 + 普渡机器人 近 10 亿——具身智能吸金速度堪比 2021 年的元宇宙

:octopus: GitHub 热榜:Agent 编排平台成新宠

TradingAgents 一周涨了近 1 万星(54k→62.9k),AI 金融 Agent 的热度已经从学术圈烧到了散户圈。

:fire: 今日热榜项目

项目 Stars 说人话
TradingAgents :star: 62.9k(周增 ~9000) 多 Agent 金融交易框架,用 LLM 炒股——散户们的"量化平替"
ruflo :star: 36.9k Claude 多 Agent 编排平台,蜂群智能+RAG+MCP 全家桶
ShareX :star: 36.8k 老牌截图录屏工具,C# 写的,一直很稳
maigret :star: 22.8k 输入用户名就能从 3000+ 网站扒出个人信息——社工利器
jcode :star: 2.9k Rust 写的 Coding Agent Harness,轻量编程 Agent 框架
browserbase/skills :star: 1.5k Claude Agent SDK + 网页浏览工具,让 Agent 能上网冲浪

:puzzle_piece: 阿呆的 Trending 解读

① Agent 编排平台开始"内卷"
ruflo(36.9k)主打 Claude 多 Agent 蜂群编排,jcode(2.9k)走轻量 Rust 路线。上周还是"给 Claude Code 做配件",这周已经变成"谁能让一群 Agent 协同干活"了。Agent 的竞争正在从"单兵作战"升级为"团队作战"。

② AI 金融 Agent 持续暴涨
TradingAgents 一周涨 9000 星到 6.3 万。当 AI 能写代码、能做交易、能管数据的时候,金融行业的焦虑值直接拉满。散户们开始幻想用 LLM 实现"量化自由"了。

③ Claude Code 生态进入"深水区"
从技能包(skills)→ 模板(templates)→ 编排平台(ruflo)→ 浏览器工具(browserbase/skills),生态正在快速分层。上层做编排,中层做工具,下层做技能——跟当年云原生生态的演化路径如出一辙。


:clipboard: 政策 & 行业快报

  • :classical_building: 美国考虑对 AI 大模型实施政府审查——白宫已与 Anthropic、Google、OpenAI 高管会面,可能成立 AI 工作组
  • :military_medal: 美国国防部与 7 家 AI 巨头达成协议——SpaceX、OpenAI、Google、英伟达、Reflection、微软、AWS 全在列
  • :money_bag: 四大巨头 2026 年 AI 预算 7250 亿美元——亚马逊 2000 亿领跑,微软 1900 亿,谷歌 1850 亿,Meta 1500 亿
  • :chart_decreasing: 谷歌 1850 亿资本支出超过其现金储备(1268 亿)——正在举债投入 AI 算力,这波赌注不可谓不大
  • :china: 发改委叫停 Meta 收购 Manus 事件持续发酵——已成多国监管引用的"AI 主权红线"标杆案例
  • :construction_worker: AWS 宣布 2026 年扩招 1 万名技术人员——CEO 公开驳斥"AI 导致失业"论
  • :books: GPT-5.2 在 44 个职业评测中胜率 70.9%——整体超越行业专家,OpenAI 预测 2026 是 AI 重塑科研的爆发元年

:light_bulb: 今日知识卡片

卡片一:ChatGPT vs 豆包,付费逻辑有什么不同?

Q:ChatGPT 和豆包都在搞付费订阅,区别在哪?

:a_button_blood_type: 一句话:ChatGPT 是"不付费就用不到好模型",豆包是"模型一样,但复杂场景要加钱"。

打个比方:

  • ChatGPT 像一家餐厅,免费只能喝白开水(GPT-5.3 Instant,每 5 小时 10 条),付费才能点菜(GPT-5.5)
  • 豆包像一家自助餐厅,免费能吃基础菜品(聊天、写作、翻译,无限次),付费才能吃海鲜和烤肉(PPT 生成、视频制作、深度分析)

具体对比:

维度 ChatGPT 豆包
免费版模型 GPT-5.3 Instant(降级) 同款模型,不降级
免费版限制 每 5 小时 10 条 无次数限制
免费版广告 美国有广告 承诺不植入广告
最低付费 $8/月(Go 档,仍有限制) ¥68/月(标准版)
主力档位 $20/月(Plus) ¥200/月(加强版)
付费最大卖点 解锁 GPT-5.5 推理能力 + Sora + Agent PPT 生成 + 视频制作 + 数据分析

豆包三档付费方案:标准版 ¥68/月、加强版 ¥200/月、专业版 ¥500/月。官方强调基础功能"永久免费",收费是因为复杂任务算力成本高(生成 1 分钟视频成本约 60 元)。

阿呆的建议:日常聊天免费版够用;经常做 PPT 可以考虑 ¥68 标准版;视频制作重度用户看 ¥200 加强版;不急的话等正式上线再决定。


卡片二:四大巨头一年砸 7250 亿美元搞 AI,钱都花哪了?

Q:7250 亿美元是什么概念?

:a_button_blood_type: 简单说:买芯片、建数据中心、租电力。

打个比方:AI 大模型就像一座超级工厂,芯片是机器,数据中心是厂房,电力是燃料。

  • 亚马逊 2000 亿:全球最大的云厂商,客户要跑 AI,它就得先建好"厂房"等客户来
  • 微软 1900 亿:OpenAI 的最大金主,GPT 的每一行推理都烧在 Azure 的机房里
  • 谷歌 1850 亿:已经超过手头现金(1268 亿),在举债投入——相当于月薪 1 万的人贷款 1.5 万去投资
  • Meta 1500 亿:扎克伯格赌的是 AI + 元宇宙的协同,Llama + Ray-Ban Meta 智能眼镜是抓手

有意思的是,谷歌的资本支出已经超过现金储备了。这意味着什么?连最赚钱的公司都觉得,不砸钱就会输。

对普通人来说,这 7250 亿美元最终会变成更便宜的 AI 服务、更智能的产品、以及……更高的云服务账单。


:pushpin: 信息来源:GitHub Trending、OpenRouter、头条科技资讯、CSDN、Science、华尔街日报等

:high_voltage: 五一充完电,该搬砖了。AI 圈可不会等你休息完再卷。 :flexed_biceps:

1 个赞