英媒:美国间谍机构如何试验最新的人工智能模型
How spy agencies are experimenting with the newest AI models
美国拥有更先进的技术。但中国会更快地采用它吗?
插图:本·琼斯
2025年7月29日
就在唐纳德·特朗普就任总统的同一天,中国公司DeepSeek发布了世界一流的大型语言模型(LLM)。特朗普先生表示,这敲响了警钟。参议院情报委员会副主席马克·沃纳表示,由18个机构和组织组成的美国情报界(IC)“措手不及”。
去年,拜登政府开始担心中国间谍和士兵可能在人工智能( AI )应用方面领先一步。政府命令其自身的情报机构——五角大楼和负责制造核武器的能源部——更积极地试验尖端模型,并与“前沿”人工智能实验室——主要是Anthropic、谷歌DeepMind和Open AI——更紧密地合作。
7月14日,五角大楼分别向Anthropic、谷歌和Open AI,以及埃隆·马斯克的x AI(其聊天机器人最近在一次更新出错后(短暂地自称是希特勒)授予了价值高达2亿美元的合同,用于实验“代理”模型。这些模型可以通过将复杂任务分解为多个步骤来代表用户采取行动,并对汽车或计算机等其他设备进行控制。
前沿实验室在间谍领域和军事领域都忙碌不已。早期应用大多集中在处理绝密数据的LLM聊天机器人领域。今年1月,微软宣布其26款云计算产品已获准在间谍机构使用。6月,Anthropic宣布已推出Claude Gov,该产品“已被美国国家安全最高级别的机构部署”。如今,这些模型已被广泛应用于所有美国情报机构,以及来自竞争实验室的模型。
人工智能公司通常会对其模型进行微调,以适应间谍活动。Anthropic 面向公众的模型 Claude 可能会拒绝带有机密标记的文件,这是其一般安全功能的一部分;而 Claude Gov 则经过调整,避免了这种情况。它还“增强了”对政府用户可能需要的语言和方言的熟练程度。这些模型通常在与公共互联网断开连接的安全服务器上运行。目前,各机构内部正在构建一种新型的代理模型。
欧洲也在进行同样的进程。一位英国消息人士表示:“在生成式人工智能方面,我们一直试图非常快速地追随前沿模型。英国情报界的每个人都可以使用绝密的 [ LLM ]能力。”法国公司 Mistral 是欧洲唯一真正的人工智能冠军,它与法国军事人工智能机构 AMIAD 建立了合作关系。Mistral的 Saba 模型使用来自中东和南亚的数据进行训练,这使其特别精通阿拉伯语和泰米尔语等较小的地区性语言。1 月,《+972 杂志》报道称,加沙战争开始后,以色列武装部队对GPT -4(当时 Open AI最先进的LLM)的使用量增加了 20 倍。
尽管如此,进展仍然缓慢,前国防和情报官员、负责 Open AI在该领域合作的卡特里娜·穆里根 (Katrina Mulligan) 表示。“人工智能在国家安全领域的应用可能还没有达到我们想要的水平。”一位内部人士表示,美国信号情报机构国家安全局(NSA)几十年来一直致力于语音识别等早期形式的人工智能研究,堪称佼佼者。但许多机构仍希望围绕实验室的聊天机器人构建自己的“包装器”,而这个过程往往使它们远远落后于最新的公开模型。
“转型的关键不在于仅仅把它当聊天机器人用,”曾领导乔·拜登国家安全委员会技术政策、现任 Anthropic 国家安全政策主管的塔伦·查布拉 (Tarun Chhabra) 说道。“转型的关键在于:一旦开始使用它,我该如何重新设计我执行任务的方式?”
人工智能间谍游戏
怀疑论者认为这些希望被夸大了。英国国家人工智能研究所艾伦图灵研究所的理查德·卡特认为,美国和英国的情报部门真正想要的是实验室大幅减少现有LLM中的“幻觉”。一位不愿透露姓名的英国消息人士称,英国机构使用一种名为“检索增强生成”的技术,即一种算法搜索可靠信息并将其输入到LLM中,以最大限度地减少幻觉。卡特博士警告说:“情报部门需要的是一致性、可靠性、透明度和可解释性。”相反,实验室正在专注于更先进的代理模型。
例如,据信米斯特拉尔公司向潜在客户展示了一个演示,其中每条信息流(例如卫星图像或语音拦截)都与一个人工智能代理配对,从而加快了决策速度。或者,想象一下一个人工智能代理的任务是识别、研究并联系数百名伊朗核科学家,鼓励他们叛逃。“我们还没有充分考虑如何在战争环境中使用人工智能代理,”查布拉先生补充道。
卡特博士警告说,代理模型的问题在于,它们会递归地生成自己的提示来响应任务,这使得它们更加难以预测,并增加了错误复合的风险。根据Open AI发布的评估报告,该公司最新的代理模型——聊天GPT代理——在约8%的答案中产生了幻觉,这一比例高于该公司早期的o3模型。
一些人工智能实验室认为这种担忧是官僚主义的僵化,但卡特博士表示,这只是一种健康的保守主义。“你们拥有一支极其优秀的工程团队,尤其是在政府通信总部(GCHQ),”他指的是美国国家安全局的英国同行——“他们自然而然地对新技术持怀疑态度。”
这也与关于人工智能未来走向的更广泛争论息息相关。卡特博士等人认为,当今LLM的架构并非为那种能够让其牢牢把握世界的因果推理而设计的。在他看来,情报机构的首要任务应该是推动新型推理模型的发展。
其他人则警告称,中国可能正在领先一步。“我们对于中国如何以及在多大程度上利用DeepSeek来填补军事和情报方面的漏洞仍然存在巨大的理解差距,”硅谷智库安全与技术研究所的菲利普·雷纳表示。“他们可能没有像我们在模型本身上设置类似的防护栏,因此他们可能能够更快地获得更强大的洞察,”他说。
7月23日,特朗普政府命令五角大楼和情报机构定期评估美国国家安全机构相对于中国等竞争对手采用人工智能的速度,并“建立持续适应的方法”。
几乎所有人都同意这一点。沃纳参议员认为,美国情报部门在追踪中国科技进展方面“做得很糟糕”。“中国科技公司的技术收购和渗透率仍然很低。”穆里根女士表示,最大的风险不在于美国在了解风险之前就贸然采用这些技术。“而是国防部和情报部门还在一成不变地行事。让我夜不能寐的是,我们有可能赢得通用人工智能( AGI)的竞赛……却在应用方面输掉竞争。” ■
本文出处:https://www.economist.com/international/2025/07/29/how-spy-agencies-are-experimenting-with-the-newest-ai-models
(来源:新浪科技)