美媒:糟糕!人类开始学 ChatGPT说话
It’s happening: People are starting to talk like ChatGPT
令人不安的是,聊天机器人回答中过多出现的词语在人类对话中出现得更多。
2025年8月20日美国东部时间上午6:30
(Chiqui Esteban/《华盛顿邮报》;Iuliia Morozova/iStock)
作者: Adam Aleksic
Adam Aleksic 是《 Algospeak:社交媒体如何改变语言的未来》一书的作者。
如果你使用 ChatGPT、Claude、Gemini 或其他人工智能聊天机器人,你很可能假设你们说的是同一种语言。你输入英语,它输出英语。很简单,对吧?但这其实是个误解:实际上,你们说的是不同的语言。
聊天机器人不像人类那样处理文本,而是将你的提示转换成一个嵌入——一组在“向量空间”中表示的数字,有点像地图上的坐标。但是,正如地图是其领土的平面表示一样,这种嵌入也是语言的平面表示;必然会丢失一定程度的人类差异和语境。
接下来,聊天机器人会根据过去训练的回答方式,逐字预测回复内容。这种预测会利用有偏差的训练数据(它从中学习的特定文本)和有偏差的强化学习(它收到的反馈)。最终,你听到的看似英语的话语,实际上是对真实人类语音的模拟。
令人不安的是,现在有数亿人定期与聊天机器人互动,讲英语的人开始像另一端的非人类交流者一样说话。
例如,ChatGPT 使用“delve”一词的频率高于人们在书写或说话时通常使用的英语频率。佛罗里达州立大学的研究人员 Tom S. Juzek 和 Zina B. Ward 发现,这可能是由于人类反馈过程中的细微偏差和错误随着时间的推移而累积造成的。负责检查大型语言模型 (LLM) 输出的人工智能公司员工通常是来自尼日利亚和肯尼亚等国家的低薪工人,在这些国家,“delve”的使用频率高于美式英语或英式英语。
因此,轻微的词汇过度表达可能在模型中得到了强化——有时甚至比工人自己的使用频率还要高。由于工作时间紧迫和紧张的条件,检查员在浏览样本文本时可能忽略了“delve”的频率,从而导致进一步的放大。(其他一些例子包括 “intricate,” “commendable” and “meticulous.”。)
如今,这种过度使用正在渗透到全球文化中。自2022年底ChatGPT推出以来的两年里,随着研究人员开始寻求人工智能的论文帮助,“delve”在学术出版领域的出现频率增加了十倍。随着科学家和作家们对这一现象的认识不断加深,他们开始采取措施,让自己“听起来不那么像人工智能”。其实,我以前很喜欢用“delve”这个词,但现在我尽量避免使用它了。
但大多数人可能并不知道聊天机器人对某些词汇存在偏见。用户认为 ChatGPT 是在用“正常”英语说话,因为这是该工具用户界面的暗示。他们还认为,自己遇到的日常文本也是正常英语,即使这些文本也可能是人工智能生成的。随着时间的推移,他们越来越容易将这种表述与现实混淆。
事实上, 《科学美国人》上个月发表的一项研究发现,人们在自发的口头对话中开始更多地使用“delve”(深入)这个词。这不再是人工智能的功劳了;我们开始内化它的偏见,并自我重复。我说“我们”,是因为即使是反对“delve”的人也难逃其咎。我们或许可以避免使用最著名的ChatGPT赠品,但如今太多词汇的出现频率异常,我们不可能完全避免。我们是否也应该停止使用聊天机器人过度使用的“inquiry”(询问)或“surpass”(超越)?太多了,难以追踪。
随着人工智能文本、我们无法识别的人工智能文本以及真实人类语音之间的循环越来越快,我们无意中套用LLM词汇的可能性只会越来越大。心理语言学普遍认为,一个单词出现的频率会影响它在人们心理词典(即口语对话中可能使用的选项的“词典”)中的可用性。本质上,我们看到一个单词出现的频率越高,我们就越能本能地去使用它。
我们大脑语言映射的演化是正常的,但现在我们正处于一个反馈循环中,我们的“地图”正在与聊天机器人的“地图”融合。两者都与实际情况不同——人类说话方式千差万别——但这种混淆使得我们更难判断什么是真正的人类语言,什么是人工生成的语言。随着这种区别变得越来越难以辨别,我们将不断模糊现实的界限,并周期性地利用这种模糊来构建我们新的现实。随着人工智能模型继续接受自身输出和受人工智能影响的人类写作的训练,LLM语言的普及只会愈演愈烈。
从语言学角度来看,这并没有什么错。“深入研究”(delve)这个词对大脑的影响并不比它的同义词更严重。但语言预示着更深刻的社会变革。还有许多其他更为隐蔽的误解也被编码进了LLM的体系中。种族偏见、性别偏见和政治偏见——所有这些偏见都可能像语言偏见一样被灌输到模型中,但这些偏见更难被准确衡量。我们需要记住,这些并非中立的工具:它们拥有潜移默化地重塑我们思维的力量。
本文出处:https://www.washingtonpost.com/opinions/2025/08/20/chatgpt-claude-chatbots-language/
(来源:新浪科技)