DeepSeek-R1发布一周年之际曝光新模型「MODEL1」
2026-01-21 08:01:20
作者:佚名
来源:本站整理
0 阅读
1 月 21 日,据量子位报道,DeepSeek-R1 发布一周年之际对新模型「MODEL1」进行了曝光。DeepSeek 在 GitHub 更新 FlashMLA 代码,横跨 114 个文件中有 28 处提到 MODEL1,与 V32 作为不同的模型出现。已知 V32 是 DeepSeek-V3.2,MODEL1 很可能是新的架构。代码中的具体差异体现在 KV 缓存布局、稀疏性处理和 FP8 解码方面,在内存优化上有多处不同。
免责声明:
本文仅为提供市场讯息,所有内容及观点仅供参考,不构成投资建议,不代表本站观点和立场。
投资者应自行决策与交易,对投资者交易形成的直接或间接损失,作者及本站将不承担任何责任。