DeepSeek-R1 chiqarilganiga bir yil to‘lishi munosabati bilan yangi MODEL1 modeli namoyish etildi
BlockBeats xabariga ko‘ra, 21-yanvar kuni Quantum Bit tomonidan xabar qilinishicha, DeepSeek-R1 chiqarilganiga bir yil to‘lishi munosabati bilan yangi model “MODEL1” oshkor qilindi. DeepSeek GitHub’da FlashMLA kodini yangiladi, 114 ta fayl bo‘ylab 28 joyda MODEL1 tilga olingan, u V32 bilan birga turli model sifatida ko‘rsatilgan. Ma’lumki, V32 bu DeepSeek-V3.2, MODEL1 esa ehtimol yangi arxitekturadir. Koddagi aniq farqlar KV kesh tuzilmasi, siyraklikni qayta ishlash va FP8 dekodlashda namoyon bo‘ladi, xotirani optimallashtirishda bir nechta farqlar mavjud.
Mas'uliyatni rad etish: Ushbu maqolaning mazmuni faqat muallifning fikrini aks ettiradi va platformani hech qanday sifatda ifodalamaydi. Ushbu maqola investitsiya qarorlarini qabul qilish uchun ma'lumotnoma sifatida xizmat qilish uchun mo'ljallanmagan.
Sizga ham yoqishi mumkin
Whoop kadrlarni kengaytirishni tezlashtirdi va IPOga tayyorgarlik ko‘rmoqda
Eron rasmiysi: Eron neft sanoat zanjiri yetarli darajadagi bosimga bardosh bera oladi
