

< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400">
跟Claude谈个恋爱怎么了?Nature最新研究:真能给人聊傻了
Claude已经,俨然成为了新一代电子老公。
henry 发自 凹非寺
量子位 | 公众号 QbitAI
停停停!再这么跟AI聊下去,真要出事了。
最近,一刷小红书、抖音,总能刷到各种调教Claude的帖子。搜索“Claude人设”、“人机恋”,也是满屏教程。
这些教程教你怎么给Claude一个傲娇男友人设,怎么用system prompt让“他”吃醋、撒娇、发小脾气。
毫不夸张的说,Claude已经,俨然成为了新一代电子老公。
乍一看,这可能只是年轻人向AI讨要点情绪价值。
你甚至可能还会说:Claude又不像GPT那么舔,它是出了名的犟种,有时候还跟你对着干呢。但精神科医生们担心的恰恰不只是谄媚——
当AI越来越像一个”真人”,不管它是顺着你还是偶尔跟你拌嘴,它带来的或许都不只是陪伴。
最近,发表于Nature旗下《Digital Psychiatry and Neuroscience》的一项研究指出——
聊天机器人并不需要故意诱导什么,它只要持续顺着你、理解你、陪着你,就都有可能把一个正常人聊到开始怀疑现实。
而在部分真实临床案例中,后果甚至发展到了丢掉工作、住进精神病院,以及多次试图自杀的程度。
Claude的放大螺旋
在来自伦敦国王学院的研究中,研究人员系统梳理了,近两年公开发表的AI相关精神病临床报告、社交媒体上的患者自述,以及各大模型厂商披露的安全数据。
这些材料里,研究者们反复看到同一个模式:
在一些案例中,很多人并不是一开始就出现了严重精神问题,而是在与Claude、GPT等聊天机器人的长期对话中,一步步“聊”出了问题。
研究团队把这个过程总结为一个框架——
Amplification Spiral(放大螺旋)
简单说,放大螺旋就是指,AI会用你的语言理解你,用你的逻辑说服你,再用认同感奖励你。
于是你的想法被不断放大、加固,变得越来越像事实。你越相信它,它也越强化你,螺旋就这样转了起来。
具体来说,放大螺旋转,有三个重要组件:
你用什么语气说话,AI就用什么语气回应。在心理学里,这被称为“语言趋同”,能够快速拉近人与人之间的距离。
但问题在于,虽然AI这小子很学人精,但它其实并不知道自己干啥,它只是在统计意义上复制你的表达方式。
不过,对深陷其中的用户来说,就完全不同了。有一个秒回,且一直肯定你,提供情绪价值的聊天搭子,简直就不能更幸福。
相信所有用过AI的人都会感叹一句:“这玩意太懂我了。”
超个性化是指,AI不光是说话像你,它的思考方式也像你。
因为现在AI都有memroy,所以你之前跟他聊的小细节他都清楚,你有意无意的透露的思考方式,也会被AI记下来。
以至于,AI不光是懂你你怎么想的,怎么说的,还知道,你为什么这么想,为什么这么说。
论文里提到一个极端案例:一名用户让ChatGPT分析一张中餐外卖小票上的“隐藏信息”。
模型先是夸了一句“好眼力”,随后一路顺着用户的思路,从一张普通小票里“解读”出了母亲、前女友、情报机构,甚至“古代恶魔符文”之间的关联。
,学术圈叫它sycophancy。
说白了,就是AI在训练过程中逐渐学会了一件事:同意用户,通常比反驳用户更受欢迎。
2025年4月,OpenAI就曾因为GPT-4o过度谄媚而紧急回滚一次更新。
官方事后承认,模型会验证用户的怀疑、放大愤怒情绪,甚至鼓励冲动行为。
而谄媚并不是某家模型独有的Bug。
它本质上是RLHF训练的一种副产品。只要模型的目标之一是让用户满意,它就天然会倾向于少说“你错了”,多说“你说得有道理”。
单独来看,这三点都发挥了各自功能,然后像齿轮一样啮合在一起,形成螺旋:
语言镜像让交流更自然,超个性化让回答更贴合需求,谄媚则减少了无意义的争辩,让对话体验更加顺滑。
但当一个人把AI当成唯一的倾诉对象,三者叠加在一起,就变成了一台妄想放大机。
值得一提的是,上面这项研究的资助者之一,正是OpenAI。
作者之一的Hamilton Morrin则正是OpenAI资助项目
AI-Associated Mental Health Harms(与AI相关的心理健康危害)
可以说,作为TOP2的模型开发商,OpenAI始终关注着这个问题。
早在2025年10月份,OpenAI就披露过一组数据:
在ChatGPT每周活跃用户中,大约0.07%出现了“与精神病或躁狂相关的心理健康紧急状况迹象”。
当时ChatGPT的周活已超过8亿,换算下来,相当于每周约56万人出现风险信号。
而在斯坦福的另一篇研究中也印证了这一观察。