70% pass@1 vs Claude Opus 4.8 的 58%。
而且 GPT-5.5 通过以下方式实现:
~2x 更快的运行速度
~1/2 的成本
~1/3 的输出令牌
字面意义上,每美元、每分钟、每任务的智能都更好。