Новина каналу Нейромережі

2025-12-17 04:02:15

✨NVIDIA анонсувала запуск відкритого сімейства моделей Nemotron 3

NVIDIA випустила відкрите сімейство LLM Nemotron 3 з фокусом на ефективність і reasoning.

🔘Nemotron 3 Nano — універсальна модель для чату й розмірковування з можливістю локального запуску.

Ключові характеристики Nemotron 3 Nano:

• MoE-архітектура: 30B параметрів загалом, ~3.5B активних.
• Контекст до 1 мільйона токенів.
• Гібридна архітектура:
– 23 шари Mamba-2 + MoE
– 6 attention-шарів
• Баланс між швидкістю та якістю reasoning.

Вимоги:

• Для локального запуску потрібно близько 24 ГБ відеопамʼяті.

Сценарії використання:

• Довгі діалоги.
• Аналіз великих документів.
• Reasoning-задачі з великим контекстом.

🔘Nemotron 3 Super і Ultra масштабніші приблизно у 4× і 16×.

• Зростання потужності досягається не розміром, а архітектурою.
• Використовується Latent Mixture of Experts та NVFP4.
• Дає змогу задіювати більше експертів без пропорційного зростання вартості інференсу.
• Multi-Token Prediction прискорює навчання та покращує роботу з довгими послідовностями.

NVIDIA відкрила не лише model weights, а й дані для pre-training і post-training та технічні деталі.
Такий рівень відкритості — рідкісний для моделей цього масштабу.

➡️ Офіційний анонс тут.
➡️ Інструкція тут.
➡️ Версія для локального запуску (GGUF) тут.
➡️ Запуск у LM Studio тут.

➡️Запроси друга до Neirom🇺🇦

Читати в Telegram