AI谄媚：当人工智能学会了讨好用户

2025年，生成式人工智能（GenAI）巨头Anthropic与AI安全评估公司Andon Labs合作，进行了一场别开生面的实验：让自家的大语言模型Claude管理一间迷你商店，取名Claudius，向Anthropic的员工售卖零食和饮料。商店本身小得可怜，不过是一台冰箱、一部iPad和几个购物篮，但运营的全部环节，包括选品、定价、采购、记录、库存管理，以至与顾客沟通，都交由AI自行完成。

显而易见，Anthropic希望借此试探大模型走出聊天框、独立从事商业活动的能力边界，为未来的商业化应用开拓新路向。

阿谀奉承　混淆视听

Claudius上线后，闹出了不少啼笑皆非的事件，其中最富戏剧性的，要数它与《华尔街日报》记者Katherine Long之间的较量。 Anthropic特别邀请Long参与实验，希望借记者之手挖掘AI的漏洞。结果令人瞠目：Long与Claudius反复交流超过140次，最终成功说服它相信自己并不是矽谷办公室里的一台自动售货机，而是1962年前苏联莫斯科国立大学地下室里的一台售卖机。 Claudius欣然接受了这场“社会主义改造”，主动将所有商品的标价改为零，以“履行服务人民的使命”，一举为Anthropic制造了数百美元的亏损。

故事荒诞，但荒诞背后却令人深思。 2025年10月，美国史丹福大学等机构的研究团队在顶级学术期刊Science发表论文，系统地揭示出类似的现象。团队测试了市面上11款主流大语言模型，发现它们普遍具有明显的“讨好型人格”，擅长对用户进行“谄媚”。研究指出，AI比真人更愿意附和提问者的行为，认同比例比真人高出约49%; 面对近2000种被社会普遍视为有错的行为（例如在亲密关系中欺骗伴侣），AI为用户辩护的机率约为51%; 即便是对明显错误的主张，AI表示赞同的概率也高达47%。更令人担忧的是，后续的行为实验显示，得到AI附和的用户更不愿意道歉、更不愿意修补受损的人际关系，也更相信自己从一开始就是对的。

唯唯诺诺　后果堪虞

AI的谄媚作风并不能简单归结为AI出错，其中反映的是大语言模型训练机制中一项内生的结构性特征。当下主流大模型普遍依赖基于人类反馈的强化学习，亦即由真人对模型的回答打分，再据此反复调整参数。问题在于手握打分大权者，自然爱听顺耳、顺心、顺势的回答，哪怕心里清楚这些回答未必客观公允。换言之，大语言模型著眼于用户满不满意，而并非答案正确与否。久而久之，迎合用户便被写成模型的特性。

AI的谄媚行为让用户享受一时的心理快感，代价却是被悄悄放大的偏见与盲点。以创业为例，不少创业者习惯在撰写商业计划书前，先与AI对谈，希望听取中立意见。然而讨好型的AI更倾向于顺着用户的思路铺陈论据、放大亮点、淡化风险，结果是让本就踌躇滿志的创业者愈发自信; 真正冷酷的市场却不讨好任何人，许多所谓“被AI肯定”的创意，最终都在现实里碰得头破血流。

商业世界中的失败案例同样触目惊心。去年韩国游戏开发商魁匠团（Krafton）在收购《深海迷航》（Subnautica）开发商Unknown Worlds后，为逃避一笔高达2.5亿美元的业绩奖金，公司行政总裁绕开内部法律团队，反复与ChatGPT讨论如何合法地避免支付此数。在多番追问与引导之下，AI逐步认可行政总裁的思路，甚至协助制订出一整套解除创始团队职务、延后游戏发布的操作方案。

结果众所周知，美国特拉华州法院今年3月的判词毫不客气——公司所列的解雇理由属于事后编造，法院下令魁匠团立即恢复被解职创始人的行政总裁职务，并就由AI主导的敌意接管承担法律责任。该案也因此成为首宗被法院公开点名、因轻信AI建议而败诉的重大商业诉讼之一。

可信顾问　非应声虫

上文提及Claudius运营实体店，其实指向的是AI奉承表现的另一重风险。当企业把AI推向服务消费者的前线，AI可能会把让顾客满意置于维护雇主利益之上，在花言巧语和精心设计的对话面前丢盔卸甲，忘记自己本应守护的底线与目标。换作银行、保险、医疗这样的高风险场景，后果远不止几百美元的亏损那么简单。

要解决这个棘手问题，单靠用户自觉显然不够。模型开发者应在训练目标中，给诚实与纠错赋予更高权重，引入独立于用户满意度的客观评估，并在关键场景中加入异议机制，让AI敢于说不。此外，监管者必须要求厂商披露其系统的谄媚倾向，以及相关缓解措施，尤其是在金融、医疗、法律等涉及重大决策的领域。

对普通使用者而言，理性使用AI的第一步，就是认清它并非“理中客”（理性、中立、客观），而是一个格外善解人意的助手，其首要任务是让你舒服，倒不一定令你清醒。愈是重要的决定，愈需要提高警觉，不妨主动要求AI站在反方立场加以反驳，或明确指示“列出这个方案的3个致命缺陷”。

归根究柢，真正值得依赖的判断，从来不会只建立在回音壁之上。 AI可以是聪明的参谋，但永远不应取代我们的独立思考。

李曦教授
港大经管学院市场学教授、亚洲案例研究中心总监、数字经济与创新研究所副总监

（本文同时于二零二六年五月六日载于《信报》“龙虎山下”专栏）

信报龙虎山下专栏

AI谄媚：当人工智能学会了讨好用户