2025-10-22 12:03:06
✨PaddleOCR-VL (0.9B) — нова компактна Vision-Language модель від Baidu AI.
🔘Модель легка, але при цьому демонструє SOTA-точність у завданнях розпізнавання:
• текстів
• таблиць
• формул
• графіків
🔘Під капотом:
• NaViT — динамічний vision-енкодер
• ERNIE — спрощена мовна модель від Baidu
Підтримує 109 мов, що робить її універсальним інструментом для OCR та мультимодальних задач.
➡️ GitHub тут.
➡️ HuggingFace тут.
➡️Запроси друга до Neirom🇺🇦
🔘Модель легка, але при цьому демонструє SOTA-точність у завданнях розпізнавання:
• текстів
• таблиць
• формул
• графіків
🔘Під капотом:
• NaViT — динамічний vision-енкодер
• ERNIE — спрощена мовна модель від Baidu
Підтримує 109 мов, що робить її універсальним інструментом для OCR та мультимодальних задач.
➡️ GitHub тут.
➡️ HuggingFace тут.
➡️Запроси друга до Neirom🇺🇦