2025-10-12 06:02:08
✨AI21 викотила Jamba 3B, яка показала зуби топам — Qwen 3 4B та Granite 4 Micro.
Модель менша, але розумніша й працює швидше.
• Гібридна архітектура Transformer + Mamba
• 2–5× краща продуктивність завдяки компактному KV-кешу
• 256K токенів контексту без гальмування
• ~40 токенів/с навіть на довгих запитах
Jamba 3B обганяє Gemma 3 4B і Llama 3.2 3B на графіку «інтелект/швидкість».
➡️ Детальніше тут.
➡️Запроси друга до Neirom🇺🇦
Модель менша, але розумніша й працює швидше.
• Гібридна архітектура Transformer + Mamba
• 2–5× краща продуктивність завдяки компактному KV-кешу
• 256K токенів контексту без гальмування
• ~40 токенів/с навіть на довгих запитах
Jamba 3B обганяє Gemma 3 4B і Llama 3.2 3B на графіку «інтелект/швидкість».
➡️ Детальніше тут.
➡️Запроси друга до Neirom🇺🇦