news image
2025-08-12 22:02:08
⚡️GLM-4.5V — новий топ у візуальному розпізнаванні серед open-source моделей.

Змітає конкурентів, забираючи перше місце у 41 бенчмарку.

✔️ Що вміє:
• Image Reasoning — глибокий аналіз фото, робота з кількома зображеннями, точне розпізнавання об’єктів.
• Video Understanding — розкадровка та розуміння навіть довгих відео, виявлення ключових подій.
• GUI-завдання — зчитування інтерфейсів, іконок, кнопок, допомога в навігації.
• Аналіз графіків і документів — витяг даних навіть із найзаплутаніших звітів.
• Grounding — pinpoint-ідентифікація об’єктів на зображенні.

⭐ Особливості:
• Побудована на GLM-4.5-Air з використанням GLM-4.1V-Thinking.
• Архітектура MoE із 106B параметрів для гнучкого масштабування.

➡️ Спробувати тут
➡️ Документація API
➡️ Hugging Face
➡️ GitHub

Штучний Інтелект |Приватний чат
Читати в Telegram