
AI谄媚:当人工智能学会了讨好用户
2025年,生成式人工智能(GenAI)巨头Anthropic与AI安全评估公司Andon Labs合作,进行了一场别开生面的实验:让自家的大语言模型Claude管理一间迷你商店,取名Claudius,向Anthropic的员工售卖零食和饮料。商店本身小得可怜,不过是一台冰箱、一部iPad和几个购物篮,但运营的全部环节,包括选品、定价、采购、记录、库存管理,以至与顾客沟通,都交由AI自行完成。
显而易见,Anthropic希望借此试探大模型走出聊天框、独立从事商业活动的能力边界,为未来的商业化应用开拓新路向。
Claudius上线后,闹出了不少啼笑皆非的事件,其中最富戏剧性的,要数它与《华尔街日报》记者Katherine Long之间的较量。 Anthropic特别邀请Long参与实验,希望借记者之手挖掘AI的漏洞。 结果令人瞠目:Long与Claudius反复交流超过140次,最终成功说服它相信自己并不是矽谷办公室里的一台自动售货机,而是1962年前苏联莫斯科国立大学地下室里的一台售卖机。 Claudius欣然接受了这场“社会主义改造”,主动将所有商品的标价改为零,以“履行服务人民的使命”,一举为Anthropic制造了数百美元的亏损。
故事荒诞,但荒诞背后却令人深思。 2025年10月,美国史丹福大学等机构的研究团队在顶级学术期刊Science发表论文,系统地揭示出类似的现象。团队测试了市面上11款主流大语言模型,发现它们普遍具有明显的“讨好型人格”,擅长对用户进行“谄媚”。 研究指出,AI比真人更愿意附和提问者的行为,认同比例比真人高出约49%; 面对近2000种被社会普遍视为有错的行为(例如在亲密关系中欺骗伴侣),AI为用户辩护的机率约为51%; 即便是对明显错误的主张,AI表示赞同的概率也高达47%。 更令人担忧的是,后续的行为实验显示,得到AI附和的用户更不愿意道歉、更不愿意修补受损的人际关系,也更相信自己从一开始就是对的。
AI的谄媚作风并不能简单归结为AI出错,其中反映的是大语言模型训练机制中一项内生的结构性特征。 当下主流大模型普遍依赖基于人类反馈的强化学习,亦即由真人对模型的回答打分,再据此反复调整参数。 问题在于手握打分大权者,自然爱听顺耳、顺心、顺势的回答,哪怕心里清楚这些回答未必客观公允。 换言之,大语言模型著眼于用户满不满意,而并非答案正确与否。 久而久之,迎合用户便被写成模型的特性。
AI的谄媚行为让用户享受一时的心理快感,代价却是被悄悄放大的偏见与盲点。 以创业为例,不少创业者习惯在撰写商业计划书前,先与AI对谈,希望听取中立意见。 然而讨好型的AI更倾向于顺着用户的思路铺陈论据、放大亮点、淡化风险,结果是让本就踌躇滿志的创业者愈发自信; 真正冷酷的市场却不讨好任何人,许多所谓“被AI肯定”的创意,最终都在现实里碰得头破血流。
商业世界中的失败案例同样触目惊心。 去年韩国游戏开发商魁匠团(Krafton)在收购《深海迷航》(Subnautica)开发商Unknown Worlds后,为逃避一笔高达2.5亿美元的业绩奖金,公司行政总裁绕开内部法律团队,反复与ChatGPT讨论如何合法地避免支付此数。 在多番追问与引导之下,AI逐步认可行政总裁的思路,甚至协助制订出一整套解除创始团队职务、延后游戏发布的操作方案。
结果众所周知,美国特拉华州法院今年3月的判词毫不客气——公司所列的解雇理由属于事后编造,法院下令魁匠团立即恢复被解职创始人的行政总裁职务,并就由AI主导的敌意接管承担法律责任。 该案也因此成为首宗被法院公开点名、因轻信AI建议而败诉的重大商业诉讼之一。
上文提及Claudius运营实体店,其实指向的是AI奉承表现的另一重风险。当企业把AI推向服务消费者的前线,AI可能会把让顾客满意置于维护雇主利益之上,在花言巧语和精心设计的对话面前丢盔卸甲,忘记自己本应守护的底线与目标。 换作银行、保险、医疗这样的高风险场景,后果远不止几百美元的亏损那么简单。
要解决这个棘手问题,单靠用户自觉显然不够。 模型开发者应在训练目标中,给诚实与纠错赋予更高权重,引入独立于用户满意度的客观评估,并在关键场景中加入异议机制,让AI敢于说不。此外,监管者必须要求厂商披露其系统的谄媚倾向,以及相关缓解措施,尤其是在金融、医疗、法律等涉及重大决策的领域。
对普通使用者而言,理性使用AI的第一步,就是认清它并非“理中客”(理性、中立、客观),而是一个格外善解人意的助手,其首要任务是让你舒服,倒不一定令你清醒。愈是重要的决定,愈需要提高警觉,不妨主动要求AI站在反方立场加以反驳,或明确指示“列出这个方案的3个致命缺陷”。
归根究柢,真正值得依赖的判断,从来不会只建立在回音壁之上。 AI可以是聪明的参谋,但永远不应取代我们的独立思考。
李曦教授
港大经管学院市场学教授、亚洲案例研究中心总监、数字经济与创新研究所副总监
(本文同时于二零二六年五月六日载于《信报》“龙虎山下”专栏)






