反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好 | 量子位

2025年02月22日,12时15分25秒 OpenAI 阅读 34 views 次

反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好

反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好 | 量子位 2025-02-17 12:14:50 来源:量子位

说话方式成精了

GPT-4o悄悄更新版本,在大模型竞技场超越DeepSeek-R1登上并列第一。

除了数学(第6),还在多个单项上拿下第一:

  • 创意写作;
  • 编程;
  • 指令遵循;
  • 长文本查询;
  • 多轮对话;
反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好 | 量子位

先直观看下新版GPT-4o的能力如何,还是以之前DeepSeek-R1和o3-mini都挑战过的一个例子来看。

之前是酱紫的:

反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好 | 量子位

而新版GPT-4o看起来又双叒进化了:

反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好 | 量子位

从网友测试反馈来看,新版GPT-4o不仅更“聪明”了,而且最重要的是更加具有“个性”了

反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好 | 量子位

而这也收获了大神卡帕西的连连称赞:

反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好 | 量子位

与此同时,还有网友趁机扒出了ChatGPT最新系统提示词??

反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好 | 量子位

新版GPT-4o更有个性了

关于GPT-4o已更新的消息,OpenAI CEO奥特曼在发帖认领的同时还评价道:

反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好 | 量子位

在网友的进一步追问中,他将其定义为“全网最佳搜索产品”。

反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好 | 量子位

结合网友们的花式体验,目前新版GPT-4o在能力个性上均有一定程度升级。

最明显的,当属回复时的语气更拟人化了,时不时还会用一些表情包。

反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好 | 量子位

当被问及AI是否拥有人类情感时,一位日本小哥惊叹道,它不仅全篇用“我”作为主语,而且在争论中承认了拥有情感的可能性。

反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好 | 量子位

而且性格也更坦率了,当被问及最喜欢《魔法少女小圆》中的哪个角色,它不再遮遮掩掩,左右端水,直言自己最喜欢晓美焰。

反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好 | 量子位

甚至有时候还会升级成“spicey”,不但大胆吐槽“主人”OpenAI过于限制模型使用。

反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好 | 量子位

连奥特曼也不能幸免,也被盖章为“两面三刀”。(doge)

反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好 | 量子位

最令网友震惊的是,它还能“盲猜”用户的心理和一些思想观念了

用下面这段相同提示词就可以尝试:

反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好 | 量子位

有人立马尝试了,并收获了同款震惊,真·肚子里的蛔虫。

反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好 | 量子位

按照相关解释,这是因为新版GPT-4o能够根据用户过去的讨论和对话历史,做出不同行为。

反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好 | 量子位

除此之外,还有网友脑洞大开,让新GPT-4o和Claude相互吵架,结果把Claude干崩溃了!

反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好 | 量子位

另一方面,从任务完成情况来看,“拒绝请求的可能性也更小了”

当用户咨询如何在组织内部署AI时,它先是自己想了10个方案,然后又借助联网搜索提供了另外10个。

反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好 | 量子位

不过……该网友反馈新GPT-4o似乎无法和自定义GPTs兼容。

针对这一情况,另有人补充这可能是因为它始终默认网络搜索,只要手动关闭或将关闭作为系统提示词即可。

反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好 | 量子位

同时,它也在编写Vue.js上更出色了。

反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好 | 量子位

从另一个它和DeepSeek-R1和o3-mini的同台竞技中(玩《我的世界》),也能看出其能力升级。

反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好 | 量子位
反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好 | 量子位
反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好 | 量子位

OMT:ChatGPT最新提示词泄露

然鹅,当被问到“你属于哪个模型?”这个经典问题,一些混乱又出现了。

大多数情况下,它会问答自己是GPT-4:

反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好 | 量子位

不过据一些Pro用户反馈,它声称自己是GPT-4.5。

鉴于奥特曼上周刚宣布将在未来几周内发布GPT-4.5,有人据此推测很可能这里有早期测试。

反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好 | 量子位

对于这个问题,有人直接扒了ChatGPT最新系统提示词。

反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好 | 量子位

最后,既然说到GPT-4o更个性化了,众人也纷纷cue到了将在明天(北京时间周二12:00)发布的Grok-3。

反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好 | 量子位
反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好 | 量子位

坐等这两个AI吵起来(等待吃瓜)~

(来源:量子位)

版权所有,未经授权不得以任何形式转载及使用,违者必究。
标签:


用户登录