Новина каналу Нейромережі

2025-09-06 22:02:06

✨Google випустила EmbeddingGemma — нову модель для створення ембеддингів.

🔘Ключові моменти:

• компактність — лише 308M параметрів, але результати на рівні більших моделей (до 500M)
• підтримка понад 100 мов
• робота локально на пристрої без інтернету (on-device), з вимогою лише близько 200MB пам’яті після квантизації

🔘Де може бути корисним:

• приватні асистенти та RAG без відправки даних у хмару
• локальний семантичний пошук
• швидка робота навіть на слабких пристроях

Окремо варто виділити підтримку різної розмірності векторів (128–768). Модель складається з "вкладених" менших моделей, і ви можете вибирати потрібну глибину під задачу.

Google одразу подбала про інтеграції — EmbeddingGemma вже можна використовувати в sentence-transformers, llama.cpp, MLX, Ollama, LMStudio, LiteRT, Cloudflare, а також у LlamaIndex та LangChain.

➡️ Деталі тут.

➡️Запроси друга до Neirom🇺🇦

Читати в Telegram