港大经管学院
人工智能评测实验室

我们通过科学严谨、公平透明的人工智能评测体系，推动人工智能技术的突破性创新与可持续发展。

最新研究成果

图像生成

图像理解

通用能力

推理能力

幻觉

高阶推理
（多模态推理&奥赛推理）

研究发表

主流媒体报道

人工智能安全并非创新的阻碍因素，而是实现价值的关键所在：香港大学教授如是说

重磅发布：人工智能大语言模型图像理解能力综合评测报告

多模态人工智能模型：图像生成能力评测与安全挑战

重磅发布：人工智能大语言模型图像理解能力综合评测报告

【观点】香港大学经管学院蒋镇辉教授：国产大语言模型呼唤更多原创的突破型技术

AI大語言模型評測，文心4.0中文頂呱呱

中美大语言模型竞逐：全球视角下的机遇与挑战

港大經管學院报告：文心一言4中文语境综合表现最佳

港大經管學院公佈人工智能大語言模型評測綜合排行榜

【AI】港大評測報告：英文語境國產AI模型多處劣勢　文心一言中文通用能力跑輸ChatGPT

港大綜合測評：人工智能大語言模型「文心一言4」中文表現最佳

港大評測：中文語境文心一言4表現最佳　英文語境GPT 4-turbo獨佔鰲頭

HKU says Baidu AI good for Chinese

广阔的评测范围

我们的评测涵盖来自全球的各类前沿模型。