8月20日凌晨,DeepSeek开源了Deepseek V3.1-Base版本。DeepSeek此次未对模型做任何介绍,仅将模型文件上传至Hugging Face平台。尽管发布方式颇为低调,但DeepSeek在Hugging Face趋势榜单中已上升到第4名。据网友推测,新升级版本,速度更快、智能程度更高,可与GPT级模型媲美。该模型拥有6850亿参数,支持 BF16、F8_E4M3、F32三种张量类型,以Safetensors格式发布,便于高效推理,还具备扩展的上下文窗口。
8月20日凌晨,DeepSeek开源了Deepseek V3.1-Base版本。DeepSeek此次未对模型做任何介绍,仅将模型文件上传至Hugging Face平台。尽管发布方式颇为低调,但DeepSeek在Hugging Face趋势榜单中已上升到第4名。据网友推测,新升级版本,速度更快、智能程度更高,可与GPT级模型媲美。该模型拥有6850亿参数,支持 BF16、F8_E4M3、F32三种张量类型,以Safetensors格式发布,便于高效推理,还具备扩展的上下文窗口。