人工智能AI幻觉能力评测体系 - 港大人工智能评测实验室

幻觉能力评测体系

“幻觉”指模型生成内容在事实依据或语境契合度上存在的问题，具体分为两类：事实性幻觉和忠实性幻觉。事实性幻觉是指模型输出内容与真实世界信息不符，既包括对已知知识的错误调用（如张冠李戴、数据错记），也包括对未知信息的虚构（如编造未验证的事件、数据）。忠实性幻觉是指模型未能严格遵循用户指令，或输出内容与输入上下文矛盾，包括遗漏关键要求、过度引申、格式错误等。为清晰呈现大语言模型幻觉的产生路径，并帮助读者更好理解，其核心要素的简要示意图如图1所示。

图1. 大模型幻觉产生示意图