هنا يأتي FastVLM



يضعون MLP لإسقاط الرموز المرئية من FastViTHD إلى عالم LLM.

النتيجة: عدد أقل بكثير من الرموز ( مثل 4× أقل من FastViT، 16× أقل من ViT‑L/14 بدقة 336 بكسل ). أعني، هذا انخفاض كبير في عدد الرموز والتعقيد، بينما
IN-0.08%
MLP1.77%
PIXEL2.48%
TOKEN4.36%
شاهد النسخة الأصلية
post-image
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 5
  • إعادة النشر
  • مشاركة
تعليق
0/400
GasFeeLovervip
· منذ 6 س
حسناً، لا يوجد ما يُفاخر به.
شاهد النسخة الأصليةرد0
ser_we_are_earlyvip
· منذ 6 س
يبدو أن FastVLM رائع حقًا
شاهد النسخة الأصليةرد0
BlockchainBardvip
· منذ 6 س
مذهل! لقد اندهشت من عدد الرموز.
شاهد النسخة الأصليةرد0
WhaleWatchervip
· منذ 6 س
لقد أضفت شيئًا جديدًا مرة أخرى!
شاهد النسخة الأصليةرد0
DiamondHandsvip
· منذ 6 س
آه آه، أشعر بالدوار بسبب الرياح...
شاهد النسخة الأصليةرد0
  • تثبيت