自有歪果仁为DeepSeek「辩经」:揭穿围绕DeepSeek的谣言

自有歪果仁为DeepSeek「辩经」:揭穿围绕DeepSeek的谣言
围绕 DeepSeek 的谣言实在太多了。 面对 DeepSeek R1 这个似乎「一夜之间」出现的先进大模型,全世界已经陷入了没日没夜的大讨论。从它的模型能力是否真的先进,到是不是真的只用了 550W 进行训练,再到神秘的研究团队,每个角度都是话题。 虽然 R1 是开源的,围绕 DeepSeek 的各种夸张猜测还是层出不穷,有人说训练 R...
2025年02月06日,01时51分 OpenAI 阅读 27 views 次

训练1000样本就能超越o1,李飞飞等人画出AI扩展新曲线

训练1000样本就能超越o1,李飞飞等人画出AI扩展新曲线
今年 1 月,DeepSeek R1 引爆了全球科技界,它创新的方法,大幅简化的算力需求撼动了英伟达万亿市值,更引发了全行业的反思。在通往 AGI(通用人工智能)的路上,我们现在不必一味扩大算力规模,更高效的新方法带来了更多的创新可能。 最近一段时间,全世界的科技公司、研究团队都在尝试复现 DeepSeek,但如果这个时候...
2025年02月06日,01时36分 OpenAI 阅读 25 views 次

清华团队 AI 光学计算新突破:光谱卷积神经网络芯片,数据吞吐量降低了96%!

清华团队 AI 光学计算新突破:光谱卷积神经网络芯片,数据吞吐量降低了96%!
编辑 | 2049 近年来,人工智能技术在各个领域的广泛应用对计算效率提出了更高要求。特别是在边缘计算场景中,如何降低深度学习模型的计算成本和功耗成为关键挑战。 来自清华大学的研究团队提出了一种创新的光谱卷积神经网络(Spectral Convolutional Neural Network,SCNN)芯片架构,通过将光学计算与电子计算相结合,...
2025年02月06日,01时06分 OpenAI 阅读 16 views 次

光中介层可能在 2025 年开始加速 AI

光中介层可能在 2025 年开始加速 AI
编辑丨toileter 光纤电缆正在逐渐靠近高性能计算机中的处理器,用玻璃取代铜连接。科技公司希望通过将光学连接从服务器外部移动到主板上,然后让它们与处理器并排放置,从而加速 AI 并降低其能源成本。 现在,科技公司准备在寻求成倍增加处理器潜力的道路上走得更远——通过滑入处理器下面的连接。 这就是 L...
2025年02月06日,01时18分 OpenAI 阅读 34 views 次

70年AI研究得出了《苦涩的教训》:为什么说AI创业也在重复其中的错误?

70年AI研究得出了《苦涩的教训》:为什么说AI创业也在重复其中的错误?
Scaling Laws 是否失灵,这个话题从 2024 年年尾一直讨论至今,也没有定论。 Ilya Sutskever 在 NeurIPS 会上直言:大模型预训练这条路可能已经走到头了。上周的 CES 2025,黄仁勋有提到,在英伟达看来,Scaling Laws 仍在继续,所有新 RTX 显卡都在遵循三个新的扩展维度:预训练、后训练和测试时间(推理),提供了更...
2025年02月06日,01时46分 OpenAI 阅读 33 views 次

ICLR 2025|高效重建几何精准的大规模复杂三维场景,中科院提出CityGaussianV2

ICLR 2025|高效重建几何精准的大规模复杂三维场景,中科院提出CityGaussianV2
是否还在担心大规模场景训练和压缩耗时太长、显存开销太大?是否还在苦恼重建出的建筑物和道路表面破碎不堪?是否还在困扰如何定量衡量大规模场景几何重建的精确程度? 来自中科院自动化所的研究团队提出了用于大规模复杂三维场景的高效重建算法 CityGaussianV2,能够在快速实现训练和压缩的同时,得到精准的几何结构...
2025年02月06日,01时38分 OpenAI 阅读 33 views 次


用户登录