Gemini 2.5 Pro登顶三冠王!AI最强编程屠榜,全面碾压Claude 3.7

Gemini 2.5 Pro登顶三冠王!AI最强编程屠榜,全面碾压Claude 3.7
新智元报道 编辑:犀牛 桃子 【新智元导读】谷歌Gemini 2.5 Pro(I/O版)横空出世,强势登顶LMAreana,斩获文本、视觉、编码三连冠,甚至编程能力全面碾压Claude 3.7,地表最强编码模型诞生。 AI编程王座,一夜易主。 昨晚,谷歌放出全新升级的Gemini 2.5 Pro Preview(I/O版),一举拿下三连冠,登顶LMeana。 它成为...
2025年05月07日,16时38分 科技新知 阅读 41 views 次

中国AI投资人:练习时长两年半

中国AI投资人:练习时长两年半
大模型的序章结束了。 模型的故事发生了一些微妙的变化,比如,没人敢说中国模型不行了。 所有投资人都告诉我们:「这个真的要感谢 DeepSeek」。 也要感谢Manus,他们最先搭出了一个产品,证明了产品的技术栈正在变复杂。复杂会带来多元,多元意味着更多可能性。 Manus也证明了一句大家前两年还有点心虚的话:应用是中...
2025年05月07日,14时00分 科技新知 阅读 48 views 次

碾压Cursor?谷歌突发Gemini 2.5 Pro预览版,编码能力全网第一

碾压Cursor?谷歌突发Gemini 2.5 Pro预览版,编码能力全网第一
I/O 前夕,谷歌突发 Gemini 2.5 Pro 预览版 昨晚,谷歌在 I/O 大会之前宣布推出 Gemini 2.5 Pro Preview(I/O 版)。作为其旗舰产品 Gemini 2.5 Pro AI 模型的升级版本,搜索巨头宣称该模型在多项主流基准测试中均名列前茅。 Gemini 2.5 Pro Preview(I/O 版)可通过 Gemini API 以及谷歌的 Vertex AI 与 AI Studio 平台...
2025年05月07日,14时56分 科技新知 阅读 33 views 次

没有大厂敢跟小红书

没有大厂敢跟小红书
“小红书取消竞业,预计大厂无人敢跟。” 专注互联网大厂及AI领域的资深猎头方述(化名)告诉字母榜,继近日小红书全员信宣布5月1日起取消所有员工竞业协议后,其余的互联网大厂内,除了私底下员工群内聊得火热外,大厂们却没有跟进的动作。 原因昭然若揭,“普通员工的竞业收缩一下无妨,真到了猎头争相去挖的AI人才,恐怕...
2025年05月07日,09时51分 科技新知 阅读 15 views 次

大模型集体“挂科”!全新中文网页检索测试:GPT-4o准确率仅6.2%

大模型集体“挂科”!全新中文网页检索测试:GPT-4o准确率仅6.2%
你以为大模型已经能轻松“上网冲浪”了? 新基准测试集BrowseComp-ZH直接打脸主流AI。 BrowseComp-ZH是一项由港科大(广州)、北大、浙大、阿里、字节跳动、NIO等机构联合发布的新基准测试集,让20多个中外主流大模型集体“挂科”: GPT-4o在测试中准确率仅6.2%;多数国产/国际模型准确率跌破10%;即便是目前表现最好的OpenA...
2025年05月07日,08时03分 科技新知 阅读 23 views 次

早报|新西兰拟禁止 16 岁以下青少年用社交媒体/Android 新设计语言曝光/特斯拉:国产化率超 95%

早报|新西兰拟禁止 16 岁以下青少年用社交媒体/Android 新设计语言曝光/特斯拉:国产化率超 95%
苹果 AI 国行版最快 6 月能用 Google 发布 Gemini 2.5 Pro(I/O 预览版) 新西兰拟禁止 16 岁以下青少年使用社交媒体 SpaceX 城市正式成立 OpenAI 同意以 30 亿美元收购 AI 编程器「Windsurf」 超越 DeepSeek-R1,英伟达开源新推理模型 阿里通义再失大将 特斯拉:本地国产化超 95% 京东联手胖东来打造供应链产业基地 阿...
2025年05月07日,08时48分 科技新知 阅读 103 views 次


用户登录