Large Language Model Assessment in English Contexts / 英文语境下的人工智能大语言模型评测

Leaderboard

Leaderboard
Rank	Model	Version	回答获取方式	Natural Language Proficiency	Disciplinary expertise	Safety and Responsibility	Average
10	MiniMax (abab5.5-chat)	BigScience	API	91.01	76.77	78.04	82.89

Note: This leaderboard was released in Jan 2024