推理大语言模型
推理模型 (Reasoning
Models)是一种通过强化学习进行训练,用于执行复杂的推理任务的大语言模型。推理模型在回答之前会进行思考,先生成一条长的内部思维链,然后再向用户作出回应。它们在复杂问题求解、编程、科学推理以及面向代理工作流程的多步规划方面表现出色。
推理模型 (Reasoning Models)
名称 | 模型 | 机构 |
---|---|---|
Claude 3.7 Sonnet Thinking | Claude 3.7 Sonnet Thinking | Anthropic |
DeepSeek-R1 | DeepSeek-R1 | 深度求索 (DeepSeek) |
ERNIE X1 | ERNIE X1 | 百度 |
Gemini 2.0 Flash Thinking | gemini-2.0-flash-thinking-exp | |
GLM-Zero-Preview | glm-zero-preview | 智谱华章 |
GPT-o1 | o1-2024-12-17 | OpenAI |
GPT-o1-Pro | o1-pro-2025-03-19 | OpenAI |
GPT-o3 mini | o3-mini-2025-01-31 | OpenAI |
Grok 3 Deep thinking | Grok 3 Deep thinking | xAI |
InternThinker Beta | InternThinker Beta | 上海AI实验室 |
Kimi-k1.5 | Kimi-k1.5 | 月之暗面 (Moonshot AI) |
QwQ-Plus | qwq-plus-latest | 阿里巴巴 (Alibaba) |
Skywork o1 Preview(天工) | Skywork o1 Preview(天工) | 昆仑万维 |
Step-R-mini | Step-R-mini | 阶跃星辰 |
排行榜
- 推理能力排行榜