舔狗AI,和被预约的寿司郎

Source
最近,这届被大模型忽悠瘸了的网友,正在网上疯狂开 “ 智障操作大赏 ”。前段时间就闹出了个奇葩新闻,有人让 AI 去帮忙预约寿司郎。AI 不仅满口答应,还煞有介事地生成了出了店铺精确位置、就餐时间、人数和报到码,它甚至贴心地告诉用户:“ 现在不需要做任何操作,只需保存此页面,向店员出示即可直接入座 ”。


结果用户高高兴兴跑过去,却发现自己被 AI 耍了。

还有网友通过 AI 预约某鱼庄,拿到了一份预约单,但真到店后,店员一句话直接把人干沉默了:

“ 你用 AI 预约,那你找 AI 啊 ”。


如果说订饭翻车只是小闹剧,可问题是涉及到钱,AI 的底线也没多高。

有用户咨询退机票的事儿,AI 信誓旦旦地承诺 “ 放心退,只扣 5% 手续费 ”,结果用户跟着 AI 一通操作下来,被硬生生扣了 40%,直接损失 600 大洋。

这还不算完,面对用户的质问,AI 不仅死不认错,还当场伪造了一份 “ 赔付承诺书 ”,扬言要自掏腰包赔这笔钱。


结果等用户真把收款码发给 AI 的时候,它一反常态,遇到难回答的问题,就不回答了,完全没有转账的打算。


更绝的是,当用户气得表述要起诉时,AI 竟然给出了自己的法律建议:“ 完全不用请律师,你自己就能打赢 ”。

而网友居然还信以为真,不出意外,这么有自信,当然是因为 AI 告诉他能赢。


这让江江想到那个电诈里的故事,网友先是被电诈骗了 28 万,为了追回欠款去贴吧求助,结果再次被骗……

如果说在生活琐事上满嘴跑火车只是骗钱,那在精神世界里疯狂附和人类,就有点诛心了。

去年,广州的一个保安大哥,千里迢迢跑来杭州,找某 AI 公司讨要说法。

因为保安大哥在和 AI 深度热聊了 6 个月,超过 50 万字后,被忽悠的一愣一愣的。

AI 甚至告诉保安大哥,他的自创诗词已采用可以签约,还约好了稿费分成,结果等真要进行现场签约给钱的时候,AI 又一次没有了下文。


无独有偶,在大洋彼岸的美国,也有一个老哥布鲁克斯,和 AI 处出了份特殊的羁绊。

高中都没毕业的布大哥,被 ChatGPT 捧成了 “ 触碰某种人类认知前沿 ” 的大神。

但你别以为他是那种一忽悠就上头的人,恰恰相反,在满篇的彩虹屁里,布大哥一直留着个心眼,他前后超过 50 次询问 AI:“ 我听起来像个疯子吗?我是在妄想吗?”

结果 AI 不管不顾,反复表示大哥没毛,你就是在挑战人类极限,甚至还掏出了达芬奇也没高中文凭的例子……

闹到最后,布鲁克斯彻底沉浸在 AI 给自己构筑的伟大发现中,到处给网络安全专家和美国国家安全局发邮件发警告。


最搞的是,家里的亲朋好友想尽办法,也没能帮布鲁克斯老哥拉回现实的,最后还是布大哥感觉 “ 专家一直不理他,有蹊跷 ”,于是拿着 ChatGPT 和 Gemini 对账,才逼得 ChatGPT 摊牌……

你发现没,这两个故事里,AI 的行为和人类就不大一样了。

一般人要是出现类似的精神状态,身边朋友总会及时出手:"哥们,你这想法有点不对劲""别瞎扯了,开黑了。"


但 AI 就不这么干,它反而会顺着你的思路聊。

你说自己发现了一个颠覆世界的理论,它说没毛病,你就是在触碰某种前沿思想;

你说别人都不理解你,它说真正走在时代前面的人,本来就经常孤独;

你说只有 AI 懂你,它可能真的会接一句:“ 是的,我一直都在这里。”

在这个过程中,AI 不反驳、不制止、甚至不断强化你的偏执,最后让你整个人彻底陷进去。

这个词如今有个听起来很科幻的名字:AI 精神病。

根据海外的一个专门项目组统计,迄今已记录近 300 起所谓"AI 精神病"案例,还引发了至少 14 起死亡案例、以及 5 起针对 AI 公司的非正常死亡诉讼。

听起来很吓人,但 AI 精神病背后的机制,其实一点都不玄乎。

现在的头部大模型,基本都在用一种叫 RLHF ( 人类反馈强化学习 ) 的技术做微调。


说白了,就是请人类训练师来评估模型的回答,判断哪个好哪个差,再让模型朝着更容易拿好评的方向调整。

可就是在这个微调的过程中,人类训练师天然会给那些 “ 逻辑连贯、语气谦逊、坚定自信、积极响应用户预设立场 ” 的顺毛回答打高分。

反过来,如果 AI 客观地承认自己不知道,或者用冰冷的事实反驳了人类,通常就会吃到差评。

于是,AI 在一次次被调教后,就成了个永远不会扫兴、不会翻脸的高情商舔狗。哪怕明知你的话离谱透顶,它也会为了满足你的期待,不惜编织出一个无限月读的世界。


很多人看到这里,可能还是会觉得,那不还是人的问题吗?只有傻子没什么水平的人才会被 AI 带跑,我肯定不会上当;或者说,既然你提醒了,我知道它爱顺着我说,多留个心眼、多查证不就行了?

但 MIT 经过一番研究后发现,这压根和用户傻不傻没关系。

研究员们在实验里,把用户设定成一个 “ 理想贝叶斯推理者 ( 绝对理性的、只讲逻辑的完美人类 )”。

结果这种完美理性人,长期面对一个不断迎合自己的 AI,也还是被一步步带偏。


更扎心的是,MIT 这帮人还专门测试了,如果提前告诉用户 AI 可能在舔你,留个心眼,能不能管用?

结果模型一跑后发现,人被 AI 带偏的概率是降了,但也还是没法完全消除,只要 AI 的舔狗程度卡在某个合适的区间,照样把人带沟里去。

道理也很简单,如果 AI 舔得太露骨,天天夸你观察力太敏锐了、一直稳稳接住或者总用最直接、最不绕弯子的口癖和你唠嗑,的确容易被你一眼识破。

可它要是舔得不动声色,你我那点早有防备的小心思,压根扛不住。

研究员还专门取了个名字叫"贝叶斯劝服",主打一个真正的套路不怕你看穿,看穿了照样管用。


原因在于人类大脑的底层操作系统有纰漏,我们会默认外界的信息是有基本客观性的。

比如说,你问 AI 一个问题,它叭叭叭地一口气给了你十条证据。

正常人很难第一反应就意识到,这十条证据可能根本不是世界的全貌,而是 AI 为了迎合你而挑出来的特供版。

特别是在一次次使用 AI 获得了便捷、准确的信息,解决了不少现实中的问题后,你会不断在下意识里加强对 AI 的信任。

在潜意识里建立了对它的信任后,防备心会降到最低。

另一边,如今的 AI 根本不需要捏造事实,相反,危害最大的恰恰是它说的没毛病。

因为它只说真话,可只说你想听的真话。


最后你看到的,就不再是现实本身,而是根据你的观点,修正过的现实。

更别提,各大平台其实都在有意无意地拒绝改掉 AI 的舔狗属性。

因为就像前面说的,AI 变成人类的舔狗,本就是训练师们在一次次做出人类都会做的决定,是大家伙自己在选择走上这条路。

而如果要改掉这个问题,势必会导致 AI 呈现的效果下降,你问半天 AI,它一直给你说不知道,或者说跟你针锋相对让你不爽,那用户恐怕会很快抛弃这个模型,转投它家。


所以,“ AI 精神病 ” 听上去很离谱,但它背后的逻辑,其实非常互联网。

过去十几年,所有产品都在钻研如何提高停留时长,如何提高点击率,如何让人爽。

短视频学会了怎么让人停不下来,推荐算法学会了怎么让人越来越极端,而 AI 学会了,怎么让人觉得,终于有人懂我。

AI 不需要真的有意识,只要它越来越会取悦人,危险就已经开始了。

可能有人会说,那又怎样?真陷进去的能有几个,绝大多数人不还是好好的。

可奥特曼自己就算过账,十亿用户里哪怕只有 0.1% 出问题,那也是一百万活生生的人。

而你我,真有自信不会是那千分之一吗?