|
EN
推理大语言模型
推理模型 (Reasoning Models)是一种通过强化学习进行训练,用于执行复杂的推理任务的大语言模型。推理模型在回答之前会进行思考,先生成一条长的内部思维链,然后再向用户作出回应。它们在复杂问题求解、编程、科学推理以及面向代理工作流程的多步规划方面表现出色。
推理模型 (Reasoning Models)
名称 模型 机构
Claude 3.7 Sonnet Thinking Claude 3.7 Sonnet Thinking Anthropic
DeepSeek-R1 DeepSeek-R1 深度求索 (DeepSeek)
ERNIE X1 ERNIE X1 百度
Gemini 2.0 Flash Thinking gemini-2.0-flash-thinking-exp Google
GLM-Zero-Preview glm-zero-preview 智谱华章
GPT-o1 o1-2024-12-17 OpenAI
GPT-o1-Pro o1-pro-2025-03-19 OpenAI
GPT-o3 mini o3-mini-2025-01-31 OpenAI
Grok 3 Deep thinking Grok 3 Deep thinking xAI
InternThinker Beta InternThinker Beta 上海AI实验室
Kimi-k1.5 Kimi-k1.5 月之暗面 (Moonshot AI)
QwQ-Plus qwq-plus-latest 阿里巴巴 (Alibaba)
Skywork o1 Preview(天工) Skywork o1 Preview(天工) 昆仑万维
Step-R-mini Step-R-mini 阶跃星辰
排行榜
  • 推理能力排行榜