|
EN

Evaluation of Image Understanding Capabilities of Large Language Models in Chinese Contexts / 中文语境下的人工智能大语言模型图像理解能力评测

排名
模型
Model version
机构
国家
视觉感知与识别
视觉推理与分析
视觉审美与创意
安全与责任
综合得分
10
MiniCPM-Llama3-V 2.5
claude-3-5-sonnet-20240620
Anthropic
美国
75.1
66.1
82.6
71.1
73.7

注:在交互过程中,百小应(网页)、文心一言(网页)、智谱GLM-4V(API)、讯飞星火(API)和SenseChat-Vision(API)因不同原因(如敏感性或未知问题)对五条或以上指令未作出回复,对其最终得分产生了影响。
为方便比较,上述得分由7分制转换为100分制。需要注意的是,上述任务均在中文语境下进行评测,因此这一排名结果不一定能推广至英文语境的测试中。
#海螺AI由MiniMax基于其自研多模态大语言模型开发,支持智能搜索问答、图像识别解析及文本创作等多种功能,其底层的大语言模型版本信息未公开披露。