
2024-08-01 12:00:01
ChatGPT та інші ШІ-моделі не склали українське ЗНО
Українські дослідники створили ZNOVision - перший багатоформатний тест для ШІ, який перевіряє знання з 13 предметів ЗНО українською мовою. Результати: жодна з моделей не подолала поріг у 70%.
Найкращий бал — 67,5% у Gemini Pro, GPT-4o набрав лише 47%.
Найбільше проблем було в питаннях із візуальними елементами. Моделі не впізнавали українські слова на зображеннях, плутали одиниці виміру, ігнорували частину умов.
Бізнес Інсайдер
Українські дослідники створили ZNOVision - перший багатоформатний тест для ШІ, який перевіряє знання з 13 предметів ЗНО українською мовою. Результати: жодна з моделей не подолала поріг у 70%.
Найкращий бал — 67,5% у Gemini Pro, GPT-4o набрав лише 47%.
Найбільше проблем було в питаннях із візуальними елементами. Моделі не впізнавали українські слова на зображеннях, плутали одиниці виміру, ігнорували частину умов.
Бізнес Інсайдер