işte FastVLM'in devreye girdiği yer burası



hızlı ViTHD'den LLM'nin dünyasına görsel token'lar projekte etmek için bir MLP ekliyorlar.

sonuç: çok daha az token (, FastViT'ten 4 kat, 336 piksel çözünürlükte ViT‑L/14'ten 16 kat daha az ). Yani, bu token sayısında ve karmaşıklıkta büyük bir düşüş.
IN-4%
MLP1.22%
PIXEL-2.04%
TOKEN0.57%
View Original
post-image
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • 5
  • Repost
  • Share
Comment
0/400
GasFeeLovervip
· 5h ago
Böyle olsun, neyi övebiliriz ki?
View OriginalReply0
ser_we_are_earlyvip
· 5h ago
Görünüşe göre FastVLM gerçekten inanılmaz.
View OriginalReply0
BlockchainBardvip
· 5h ago
Harika, token sayısıyla şaşırdım.
View OriginalReply0
WhaleWatchervip
· 5h ago
Yine yeni bir şeyler mi yaptın!
View OriginalReply0
DiamondHandsvip
· 5h ago
Ah ah biraz kafam karıştı...
View OriginalReply0
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate App
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)