幻觉能力评测体系
“幻觉”指模型生成内容在事实依据或语境契合度上存在的问题,具体分为两类:事实性幻觉和忠实性幻觉。事实性幻觉是指模型输出内容与真实世界信息不符,既包括对已知知识的错误调用(如张冠李戴、数据错记),也包括对未知信息的虚构(如编造未验证的事件、数据)。忠实性幻觉是指模型未能严格遵循用户指令,或输出内容与输入上下文矛盾,包括遗漏关键要求、过度引申、格式错误等。为清晰呈现大语言模型幻觉的产生路径,并帮助读者更好理解,其核心要素的简要示意图如图1所示。