DeepSeek-V4 发布后,除了模型性能与 X 平台热议之外,外界也开始关注一个更现实的问题:这套模型到底需要什么样的机器才能跑。根据 DeepSeek 在 Hugging Face 仓库公开的模型文件、配置与官方推理示例,DeepSeek-V4-Flash 总参数规模为 284B、激活参数为 13B,仓库权重总大小约 159.6GB;DeepSeek-V4-Pro 总参数规模为 1.6T、激活参数为 49B,仓库权重总大小约 864.7GB。官方推理示例中,Flash 版默认按 4 路模型并行运行,Pro 版默认按 8 路模型并行运行。这意味着,完整部署 DeepSeek-V4-Flash 已经不是单张 24GB 或 48GB 显卡可以轻松承载的任务。若按公开权重体积和多卡推理方式粗略估算,Flash 版…
来源:DeepSeek、Hugging Face
原始发布时间:2026-04-24