DeepSeek更新新模型 可一次性处理超长文本
新浪科技讯 2月11日晚间消息,多名用户反馈,DeepSeek在网页端和APP端进行了版本更新,支持最高1M(百万)Token的上下文长度。而去年8月发布的DeepSeekV3.1上下文长度拓展至128K。
实测中发现,DeepSeek在问答中称自身支持上下文1M,可以一次性处理超长文本。提交超过24万个token的《简爱》小说文档,DeepSeek可以支持识别文档内容。
之前曾有知情人士称,DeepSeek 春节更可能推出的是针对V3系列模型的小幅更新。但该人士同时透露,真正的重头戏仍在路上。DeepSeek下一代旗舰模型预计将是一款万亿参数级别的基础模型,正因规模大幅跃升,训练速度明显放缓,导致发布进程有所延后。
海量资讯、精准解读,尽在新浪财经APP
责任编辑:何俊熹
(来源:新浪科技)
