news image
2025-09-27 04:02:08
Кохана, прокидайся, у нас перша українська мультимодальна LLM ☕️

Вийшла MamayLM v1.0 — модель на базі Gemma 3, натренована на датасеті Kobza (писав про нього туточки). Gemma обрали, бо базова модель і так добре знає українську, тож якщо трохи допилити, то взагалі буде бомба 💣

Модель краще за будь-яку іншу знає нашу історію та культуру, а також файно вирішує українське ЗНО — на бенчмарку, який нещодавно вірусився, MamayLM упевнено обходить майже всі опенсорсні моделі, навіть з більшою кількістю параметрів. Що правда, коли справа доходить до чогось більшого, ніж просто текст (а ще й зображення/формули) Qwen все ще вище 😞

Є дві версії: 4b та 12b. Квантизована версія 12b на диво шустра — на MacBook Pro з M3 видає ~11 токенів на секунду.

Ви певно спитаєте мене: котику, ну й що робити з цією моделькою? 😱😱😱

🪙 Ідеальний перекладач у парі англійська-українська і назад. Особливо враховуючи підтримку документів у LMStudio;

🪙 Якщо ви працюєте з текстом (о, це я): на наборі з 500 питань MamayLM перевершує Claude 3.7 і генерує десь на рівні з GPT-5-mini в плані лінгвістичної якості тексту. До речі, оцінював Gemini. ⠒⠍⢉⢂⠥⢆⠊

🪙 Враховуючи, що модель мультимодальна, можна перетворювати зображення в текст (OCR) чи розшифровувати рукописи;

🪙 Ваш власний ШІ-бро, раджу оцей системний промт;

🪙 Якщо ваше прізвище починається на «Ф», а закінчується на «едоров» — то це файна заміна Gemini 2.0 Flash у чат-боті Дії, щоб не платити Google за API;

🪙 Ну і якщо ви просто фанат open source LLM, то це та ж Gemma 3, але трохи краще.

Ледь не забув посилання на моделі, у LMStudio просто вбийте MamayLM-Gemma-3 ☕️

ооо донат на збір (лишилося 60 498.25)
Читати в Telegram