
2024-08-01 12:00:01
🧑💻 Нова китайська нейромережа кодить на рівні Claude 4 Opus і GPT-4.1
Китайський стартап Moonshot AI випустив мовну модель Kimi K2 з 1 трлн параметрів і відкритим кодом.
Вона побудована на архітектурі MoE (суміш експертів): під час генерації активуються не всі параметри одразу, а тільки 32 млрд, які найбільше підходять до запиту. Підхід знижує обсяг обчислень, збільшує швидкість і при цьому зберігає високу точність.
Контекстне вікно - 128 тис. токенів. Модель заточена на кодинг і роботу з інструментами: самостійно викликає API, будує графіки, аналізує дані, пише і налагоджує код, але не вміє "міркувати".
🏆 У бенчмарках K2 перевершує інші відкриті моделі в програмуванні та математиці, наздоганяючи і навіть обганяючи найкращі закриті моделі!
Уже за кілька днів після запуску K2, Moonshot увійшла в топ-10 найпопулярніших компаній за запитами до API в OpenRouter: зараз вона на рівні xAI і Qwen.
➡️ Спробувати модель можна безкоштовно тут.
Китайський стартап Moonshot AI випустив мовну модель Kimi K2 з 1 трлн параметрів і відкритим кодом.
Вона побудована на архітектурі MoE (суміш експертів): під час генерації активуються не всі параметри одразу, а тільки 32 млрд, які найбільше підходять до запиту. Підхід знижує обсяг обчислень, збільшує швидкість і при цьому зберігає високу точність.
Контекстне вікно - 128 тис. токенів. Модель заточена на кодинг і роботу з інструментами: самостійно викликає API, будує графіки, аналізує дані, пише і налагоджує код, але не вміє "міркувати".
🏆 У бенчмарках K2 перевершує інші відкриті моделі в програмуванні та математиці, наздоганяючи і навіть обганяючи найкращі закриті моделі!
Уже за кілька днів після запуску K2, Moonshot увійшла в топ-10 найпопулярніших компаній за запитами до API в OpenRouter: зараз вона на рівні xAI і Qwen.
➡️ Спробувати модель можна безкоштовно тут.