2024-08-01 12:00:01
🚬 Маск не надурив, Grok-4 вийшов.

виглядає досить потужно, бенчмарки в прямому сенсі з'їв на сніданок, ⠩⡄ ⣠ ⠌ ⠊⢂⢆⠆⠡⡁⡂⡄⠔⢨⡘ 😆

що цікавого:

➡️вибив 100% на AIME25 (математичний бенчмарк);
➡️на ARC-AGI-2 майже вдвічі краще Claude Opus 4 (15,9% проти 8,6%)
➡️Humanity’s Last Exam видає 44,4% (майже вдвічі обійшов Gemini 2.5 Pro)

контекст тепер 256k токенів, тобто можна закинути свою дипломну, все буде ок 🧠

з мультимодальністю поки біда, але Маск пообіцяв, що це поправлять 😗

окремо я б виділив ще декілька цікавих моментів:

🟢API вже є, прайс цілком норм (як у Grok 3 і Claude Sonnet,), але через надмірні здібності до спілкування, модель зжирає більше токенів 😂
🟢Grok-4-mini нема, схоже і не буде;
🟢Маск анонсував власну потужну модель для генерації відео на 100k+ GB200 (як я зрозумів, знайшли/позичили вже 10 млрд вічнозелених на це діло);

та й таке. Хочеться вже потестити 🫡

а, ну і не забудьте вогник кинути за прев'ю до цього посту, я десь 3 хв часу витратив, шоб придумати 😂

🌀AI UKRAINE
Читати в Telegram