di sinilah FastVLM berperan



mereka menempelkan MLP untuk memproyeksikan token visual dari FastViTHD ke dalam dunia LLM

hasilnya: jauh lebih sedikit token (seperti 4× lebih sedikit daripada FastViT, 16× lebih sedikit daripada ViT‑L/14 pada resolusi 336 piksel). Maksud saya, itu adalah penurunan besar dalam jumlah token dan kompleksitas, sementara
IN0.64%
MLP7.52%
PIXEL0.2%
TOKEN0.87%
Lihat Asli
post-image
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 7
  • Posting ulang
  • Bagikan
Komentar
0/400
GlueGuyvip
· 2jam yang lalu
Operasi ini sebenarnya cukup hebat.
Lihat AsliBalas0
rekt_but_resilientvip
· 7jam yang lalu
Peningkatannya sangat besar di sini!
Lihat AsliBalas0
GasFeeLovervip
· 09-02 14:39
Ya sudah, tidak ada yang perlu dibanggakan.
Lihat AsliBalas0
ser_we_are_earlyvip
· 09-02 14:39
Tampaknya FastVLM benar-benar luar biasa ya
Lihat AsliBalas0
BlockchainBardvip
· 09-02 14:38
Keren sekali, jumlah tokennya membuat terkejut.
Lihat AsliBalas0
WhaleWatchervip
· 09-02 14:27
Ada hal baru lagi ya!
Lihat AsliBalas0
DiamondHandsvip
· 09-02 14:23
Aduh, saya sedikit bingung karena ditiup...
Lihat AsliBalas0
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)