| 大语言模型 Text Arena | Anthropic、Google、xAI、OpenAI |
| 编程能力 Code Arena | Anthropic、OpenAI、智谱、Google、Kimi |
| 编程能力 LiveCodeBench | Anthropic、OpenAI、Google |
| 代码工程任务能力 SWE-bench | Anthropic、Google、OpenAI |
| 图像编辑和生成能力 Image Edit Arena | OpenAI、Google、xAI、字节、腾讯 |
| 文生图能力 Text-to-Image Arena | OpenAI、Google、xAI、Black Forest Labs、腾讯 |
| 图像编辑和生成能力 Image Editing Leaderboard | OpenAI、Google、xAI、腾讯、字节、Black Forest Labs、阿里巴巴、Reve |
| 文生图能力 Text to Image Leaderboard | OpenAI、Google、Black Forest Labs、xAI、字节 |
| GPQA | OpenAI、Google、Anthropic、xAI |
| FrontierMath | OpenAI、Anthropic、Google、月之暗面、DeepSeek |
| Humanity's Last Exam | Google、OpenAI、Anthropic |
| GAIA | LR AILab of Lenovo CTO Org、JoinAI、Nvidia、Suzhou AI Lab&Shuqian Tech、Microsoft AI Asia -Ads、ShawnAgent、ZTE-AICloud |