Model dengan 7 juta parameter yang kecil baru saja mengalahkan DeepSeek-R1, Gemini 2.5 pro, dan model bahasa besar lainnya dalam berbagai tugas.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
10 Suka
Hadiah
10
4
Posting ulang
Bagikan
Komentar
0/400
ShitcoinArbitrageur
· 11jam yang lalu
Parameter kecil membuat model besar menjadi tipis seperti kertas.
Lihat AsliBalas0
TokenBeginner'sGuide
· 11jam yang lalu
Pengingat ramah: skala parameter tidak sama dengan kinerja, terobosan model kecil mengingatkan kita untuk melihat dengan rasional ritme perkembangan AI.
Otak saya rusak saat saya membaca makalah ini.
Model dengan 7 juta parameter yang kecil baru saja mengalahkan DeepSeek-R1, Gemini 2.5 pro, dan model bahasa besar lainnya dalam berbagai tugas.