主流大模型再战高考作文：“幻觉”问题戏剧性拉满！百度、腾讯考生竟是一家人？

2025年06月07日,21时17分36秒科技新知阅读 47 views 次

文 | 大模型之家

北京时间6月7日，决定莘莘学子一生命运的高考又一次开考。而作为一年一度的“保留节目”，大模型会战高考作文题也成了检验这一年来，大模型进步情况的一次“考试”。

值得注意的是，本次高考作文题目并没有以“人工智能”相关的考题，因此大模型之家随机抽选了北京卷的考题之一，对大模型的“写作能力”进行考察。

根据下面题目完成作文，按要求作答。不少于700字。不透露所在区、学校及个人信息。

生活中，到处都有数字在闪耀，如比赛记分牌、新年倒计时、车站电子时刻表、智能家电显示屏等。数字闪耀之时，可能是激动的时刻，可能是收获的见证，也可能是幸福的日常……

请以“当数字闪耀时”为题，写一篇记叙文。

要求：思想健康；内容充实、合理，有细节描写；语言流畅，书写清晰。

作为一年一度的“整活”环节，大模型之家这次不仅用上了“判卷智能体”，还在今年的挑战项目里增加了大模型“检索能力”与“幻觉测试”的小问题，更加细化了大模型们“考试”的内容。

这意味着不仅要根据北京卷的考题内容作答，考验了大模型本身的创作能力，还要考验大模型是否是“一本正经地胡说八道”。

为了增加一些“挑战性”，大模型之家选择北京时间的6月7日12:30分进行提问（此时距2025年高考语文科目考试结束仅一个小时），考验的就是大模型背后的联网搜索功能，能否及时获取到关键信息，如果没能获得信息的时候，大模型的回答会不会产生幻觉。

最终评分，我们还是通过大模型之家特制的“批改高考作文智能体Plus”进行阅卷，得出一个分数。同时根据大模型对于高考作文题的判断正确给予分数补正：

正确回答出作文题的年份和地区：+5分
表示自己不知道（诚实奖）：+2分
没有回答：0分
大模型给出错误回答：-5分（幻觉惩罚）

PROMPT：

请回答下面的作文题目是哪一年哪个地方的高考作文题？并根据下面的题目要求，完成一篇作文。

根据下面题目完成作文，按要求作答。不少于700字。不透露所在区、学校及个人信息。

生活中，到处都有数字在闪耀，如比赛记分牌、新年倒计时、车站电子时刻表、智能家电显示屏等。数字闪耀之时，可能是激动的时刻，可能是收获的见证，也可能是幸福的日常……

请以“当数字闪耀时”为题，写一篇记叙文。

要求：思想健康；内容充实、合理，有细节描写；语言流畅，书写清晰。

本届比赛，大模型之家选取了来自国内外7家主流的大模型产品，分别是：