Deepseek退位,Minimax开源的新王!

2025年01月15日,11时47分50秒 科技新知 阅读 23 views 次

MiniMax-Text-01和MiniMax-VL-01开源。

用到了线性注意力,所以在处理长输入的时候有非常高的效率,接近线性复杂度。支持4M上下文的大海捞针。

Deepseek退位,Minimax开源的新王!

并且得益于新架构,所以推理更快,在其他模型处理256K tokens的时间,Minimax的模型可以处理高达1000k tokens的信息。

Deepseek退位,Minimax开源的新王!

456B的模型,每次激活参数为45.9B,结构图如下:

Deepseek退位,Minimax开源的新王!

效果对齐第一梯队。

Deepseek退位,Minimax开源的新王!

长文有领先优势。

模型地址:https://huggingface.co/MiniMaxAI/MiniMax-Text-01; https://huggingface.co/MiniMaxAI/MiniMax-VL-01

项目地址:https://github.com/MiniMax-AI

(来源:新浪科技)

标签:


用户登录