Back
首页
排行榜
通用能力
英文语境
中文语境
综合排名
自然语言能力排名
图像理解能力
图像生成能力
推理能力
一般推理
高阶推理
多模态推理
奥赛推理
幻觉
模型
大语言模型
纯文本大语言模型
多模态大语言模型
多模态模型
视觉语言模型
文生图模型
推理大语言模型
理论与方法
评测体系
通用能力
图像理解能力
图像生成能力
推理能力
幻觉
高阶推理
评测策略
测试集
通用能力
图像理解能力
图像生成能力
推理能力
幻觉
高阶推理
关于我们
愿景及使命
团队人员介绍
联系我们
中文
|
English
港大经管学院
人工智能评测实验室
我们通过科学严谨、公平透明的人工智能评测体系,推动人工智能技术的突破性创新与可持续发展。
最新研究成果
图像生成
研究摘要
图像理解
研究摘要
通用能力
研究摘要
推理能力
研究摘要
幻觉
研究摘要
高阶推理
(多模态推理&奥赛推理)
研究摘要
研究发表
查看详情
主流媒体报道
人工智能安全并非创新的阻碍因素,而是实现价值的关键所在:香港大学教授如是说
重磅发布:人工智能大语言模型图像理解能力综合评测报告
多模态人工智能模型:图像生成能力评测与安全挑战
重磅发布:人工智能大语言模型图像理解能力综合评测报告
【观点】香港大学经管学院蒋镇辉教授:国产大语言模型呼唤更多原创的突破型技术
AI大語言模型評測,文心4.0中文頂呱呱
中美大语言模型竞逐:全球视角下的机遇与挑战
港大經管學院报告:文心一言4中文语境综合表现最佳
港大經管學院公佈人工智能大語言模型評測綜合排行榜
【AI】港大評測報告:英文語境國產AI模型多處劣勢 文心一言中文通用能力跑輸ChatGPT
港大綜合測評:人工智能大語言模型 「文心一言4」中文表現最佳
港大評測:中文語境文心一言4表現最佳 英文語境GPT 4-turbo獨佔鰲頭
HKU says Baidu AI good for Chinese
广阔的评测范围
我们的评测涵盖来自全球的各类前沿模型。