Model DeepSeek-V3.2-Exp został oficjalnie wydany i udostępniony jako open source
ChainCatcher donosi, że model DeepSeek-V3.2-Exp został dziś oficjalnie wydany i udostępniony jako open source. Model wprowadza architekturę Sparse Attention, która skutecznie zmniejsza zużycie zasobów obliczeniowych i zwiększa wydajność wnioskowania modelu. Obecnie model ten jest już oficjalnie dostępny na platformie Huawei Cloud MaaS (Model as a Service). W przypadku modelu DeepSeek-V3.2-Exp, Huawei Cloud nadal stosuje rozwiązanie dużej równoległości EP, opierając się na strukturze Sparse Attention, aby wdrożyć strategię kontekstowej równoległości przyjaznej dla długich sekwencji, jednocześnie dbając o opóźnienia modelu i wydajność przepustowości.
Zastrzeżenie: Treść tego artykułu odzwierciedla wyłącznie opinię autora i nie reprezentuje platformy w żadnym charakterze. Niniejszy artykuł nie ma służyć jako punkt odniesienia przy podejmowaniu decyzji inwestycyjnych.
Może Ci się również spodobać
Bitcoin wzrósł do 79 110 dolarów, napływ środków do ETF wyniósł 823,7 milionów dolarów
