news image
2025-10-22 12:03:06
✨PaddleOCR-VL (0.9B) — нова компактна Vision-Language модель від Baidu AI.

🔘Модель легка, але при цьому демонструє SOTA-точність у завданнях розпізнавання:

• текстів
• таблиць
• формул
• графіків

🔘Під капотом:

• NaViT — динамічний vision-енкодер
• ERNIE — спрощена мовна модель від Baidu

Підтримує 109 мов, що робить її універсальним інструментом для OCR та мультимодальних задач.

➡️ GitHub тут.
➡️ HuggingFace тут.

➡️Запроси друга до Neirom🇺🇦
Читати в Telegram