推理大语言模型
推理模型 (Reasoning Models)是一种通过强化学习进行训练,用于执行复杂的推理任务的大语言模型。推理模型在回答之前会进行思考,先生成一条长的内部思维链,然后再向用户作出回应。它们在复杂问题求解、编程、科学推理以及面向代理工作流程的多步规划方面表现出色。
推理模型 (Reasoning Models)
| 名称 | 模型 | 机构 |
|---|---|---|
| Claude 4 Opus (思考) | claude-opus-4-20250514(思考) | Anthropic |
| DeepSeek-R1 | deepseek-reasoner | 深度求索 (DeepSeek) |
| Gemini 2.5 Pro | gemini-2.5-pro-exp-05-06 | |
| GLM-Z1-Air | glm-z1-air | 智谱华章 |
| GPT-o3 | o3-2025-04-16 | OpenAI |
| GPT-o4 mini | o4-mini-2025-04-16 | OpenAI |
| GPT-5 (思考) | gpt-5-2025-08-07 | OpenAI |
| Grok 3 (思考) | Grok 3 (思考) | xAI |
| Kimi-k1.5 | Kimi-k1.5 | 月之暗面 |
| Step R1-V-Mini | Step R1-V-Mini | 上阶跃星辰 |
| 文心一言 X1-Turbo | ernie-x1-turbo-32k | 百度 |
| 日日新 V6 推理 | SenseNova-V6-Reasoner | 商汤科技 |
| 混元-T1 | hunyuan-t1-latest | 腾讯 |
| 豆包 1.5 Pro (思考) | doubao-1-5-thinking-pro-250415 | 字节跳动 |
| 通义千问 3 (思考) | qwen3-235b-a22b (思考) | 阿里巴巴 |
排行榜
- 推理能力排行榜
- 幻觉排行榜
- 多模态推理排行榜
- 奥赛推理排行榜