快遞搜1月21日消息,在DeepSeek-R1發布一周年之際,其新模型「MODEL1」的項目標識符在GitHub開源社區的FlashMLA代碼庫中曝光,與現有模型DeepSeek-V3.2並列出現。行業分析指出,「MODEL1」在鍵值緩存布局、稀疏性處理及FP8數據格式解碼支持等關鍵技術層面與現有架構存在差異,表明其可能是全新設計的模型,推測已接近訓練完成或推理部署階段。儘管業內對其定位存在不同猜測——可能是V4旗艦模型、推理模型R2或是V3系列終極版,但此次代碼更新印證了此前DeepSeek將於2月發布新一代模型的傳聞。值得注意的是,DeepSeek近期發布的兩篇技術論文介紹了「優化殘差連接」訓練方法和受生物學啟發的「AI記憶模塊」,新模型有望整合這些最新研究成果。與此同時,Hugging Face發布周年博客指出DeepSeek-R1已成為其平臺獲贊最多的模型,中國開源模型全球影響力顯著提升,深度嵌入全球AI供應鏈。