
2025-09-03 14:02:10
🤯 Новий ШІ "думає", як людина
Сінгапурський стартап Sapient створив ШІ, натхненний людським мозком. Замість звичайних "ланцюжків думок" мовних моделей дослідники реалізували "ієрархічну модель міркування", яку застосовують люди.
Наш мозок не дробить завдання на суворо послідовні кроки, а одночасно задіює два типи мислення: абстрактне і детальне. Перший - оцінює завдання і виробляє загальний підхід до вирішення, другий - обробляє деталі і відповідає за докладні обчислення.
Модель навчена всього на тисячі прикладів для кожного завдання і складається з 27 млн параметрів - у тисячі разів менше флагманських моделей OpenAI, Google та інших компаній. І ця невелика нейромережа обходить провідні LLM у логічних завданнях і стратегічному мисленні. Наприклад, вона швидко вирішує складні судоку і вибирається із заплутаних лабіринтів, з чим не справляються навіть "найрозумніші" чат-боти.
У тесті ARC-AGI, який вважається одним із найскладніших іспитів для перевірки "розумності" ШІ, модель від Sapient набрала 40,3%. Для порівняння: o3-mini-high досягла 34,5%, Claude Sonnet 3.7 - 21,2%, DeepSeek-R1 - 15,8%.
"Ці результати показують, що ієрархічна модель, що міркує, може стати революційним проривом в універсальних обчисленнях"
, - упевнені розробники.
➡️ Модель викладена на GitHub.
Сінгапурський стартап Sapient створив ШІ, натхненний людським мозком. Замість звичайних "ланцюжків думок" мовних моделей дослідники реалізували "ієрархічну модель міркування", яку застосовують люди.
Наш мозок не дробить завдання на суворо послідовні кроки, а одночасно задіює два типи мислення: абстрактне і детальне. Перший - оцінює завдання і виробляє загальний підхід до вирішення, другий - обробляє деталі і відповідає за докладні обчислення.
Модель навчена всього на тисячі прикладів для кожного завдання і складається з 27 млн параметрів - у тисячі разів менше флагманських моделей OpenAI, Google та інших компаній. І ця невелика нейромережа обходить провідні LLM у логічних завданнях і стратегічному мисленні. Наприклад, вона швидко вирішує складні судоку і вибирається із заплутаних лабіринтів, з чим не справляються навіть "найрозумніші" чат-боти.
У тесті ARC-AGI, який вважається одним із найскладніших іспитів для перевірки "розумності" ШІ, модель від Sapient набрала 40,3%. Для порівняння: o3-mini-high досягла 34,5%, Claude Sonnet 3.7 - 21,2%, DeepSeek-R1 - 15,8%.
"Ці результати показують, що ієрархічна модель, що міркує, може стати революційним проривом в універсальних обчисленнях"
, - упевнені розробники.
➡️ Модель викладена на GitHub.