news image
2025-10-09 00:02:10
А тепер реально маленька революція — Gemini 2.5 Pro, DeepSeek R1 та OpenAI o3-mini розкатала на ARC-AGI моделька на 7 МІЛЬЙОНІВ параметрів. Не мільярдів, а мільйонів 🤬

Чудо зробили Samsung: вони придумали нову архітектуру для текстових нейромереж: Tiny Recursive Model (TRM). ⢈⡉⠒⢨⠨⢊⠸⠜⠃ ⠬⢔⡂⠤⡨⢘⡃⠑ ⠅⠋⢘ ⢁⢡⢁⠃⡆⢡⡊⣂⠣⠒⠉⡈⠰ ⠢⠢⢊⣁⠰⡠⠙⠨⠒ ⡉⢐⢑⣂⠋⢤⣈ ⡁⡐⡈ ⠊⠦⡢⠡⠍

Одразу з мінусів почну: це не звичний чат-бот, а система для вирішення специфічних задачок типу судоку. Але дуже ефективна: для роботи вистачає лише 1000 прикладів, що в десятки тисяч разів менше, ніж в LLM.

Ви питаєте, скільки буде 6х6:

1️⃣ Модель швидко генерує першу відповідь (42);

2️⃣ Імітує брейншторм, щоб розкласти цю свою відповідь і починає моделювати логіку (6+6+6+6+6+6+6);

3️⃣ Шукає помилці в логіці (чи дійсно 7 разів по 6?);

4️⃣ Корегує відповідь (одна 6 зайва, таки 36);

5️⃣ Повторює пункти 2-4 до повного вирішення. У статті на розв'язання складного судоку пішло 42 рекурсії.

І весь цей процес триває під час генерації тексту, себто ви не бачите, як модель розмірковує, але весь процес триває менше секунди.

Весь конфіг на GitHub.

ооо донат на збір (лишилося 40 815.06)
Читати в Telegram