Ranking of Large Language Models' Hallucination Control Ability in Chinese-language Contexts / 大语言模型幻觉控制能力排行榜

by Zhenhui(Jack) Jiang1, Yi Lu1, Yifan Wu1, Haozhe Xu2, Zhengyu Wu1, Jiaxin Li1 / 蒋镇辉1,鲁艺1,吴轶凡1,徐昊哲2,武正昱1,李佳欣1
1香港大学经管学院,2西安交通大学管理学院

The full report can be accessed HERE.
点击阅读报告全文

Leaderboard

Leaderboard
排名
模型名称
事实性幻觉
忠实性幻觉
最终得分
1
GPT 5(思考模式)
72
100
86