Nhân dịp kỷ niệm một năm ra mắt DeepSeek-R1, mô hình mới "MODEL1" đã được tiết lộ
BlockBeats đưa tin, vào ngày 21 tháng 1, theo báo cáo từ Quantum Bit, nhân dịp kỷ niệm một năm ra mắt DeepSeek-R1, mô hình mới "MODEL1" đã được tiết lộ. DeepSeek đã cập nhật mã nguồn FlashMLA trên GitHub, trong 114 tệp có 28 lần đề cập đến MODEL1, xuất hiện như một mô hình khác với V32. Được biết, V32 là DeepSeek-V3.2, MODEL1 rất có thể là một kiến trúc mới. Sự khác biệt cụ thể trong mã nguồn thể hiện ở bố cục bộ nhớ đệm KV, xử lý tính thưa và giải mã FP8, với nhiều điểm khác biệt về tối ưu hóa bộ nhớ.
Tuyên bố miễn trừ trách nhiệm: Mọi thông tin trong bài viết đều thể hiện quan điểm của tác giả và không liên quan đến nền tảng. Bài viết này không nhằm mục đích tham khảo để đưa ra quyết định đầu tư.
Bạn cũng có thể thích
Người dùng "FilmStar" đã chi 35 ETH để mua 2 BAYC, trị giá 81,500 USD.
Morgan Stanley: Nâng giá mục tiêu của Siemens Energy lên 200 euro
Cá voi đặt lệnh mua gần 795 BTC, trị giá khoảng 61,77 triệu đô la Mỹ
Lợi suất trái phiếu Mỹ tăng, thị trường chú ý đến cuộc họp ngân hàng trung ương trong tuần này
