2025-09-27 04:02:08
Кохана, прокидайся, у нас перша українська мультимодальна LLM ☕️
Вийшла MamayLM v1.0 — модель на базі Gemma 3, натренована на датасеті Kobza (писав про нього туточки). Gemma обрали, бо базова модель і так добре знає українську, тож якщо трохи допилити, то взагалі буде бомба 💣
Модель краще за будь-яку іншу знає нашу історію та культуру, а також файно вирішує українське ЗНО — на бенчмарку, який нещодавно вірусився, MamayLM упевнено обходить майже всі опенсорсні моделі, навіть з більшою кількістю параметрів. Що правда, коли справа доходить до чогось більшого, ніж просто текст (а ще й зображення/формули) Qwen все ще вище 😞
Є дві версії: 4b та 12b. Квантизована версія 12b на диво шустра — на MacBook Pro з M3 видає ~11 токенів на секунду.
Ви певно спитаєте мене: котику, ну й що робити з цією моделькою? 😱😱😱
🪙 Ідеальний перекладач у парі англійська-українська і назад. Особливо враховуючи підтримку документів у LMStudio;
🪙 Якщо ви працюєте з текстом (о, це я): на наборі з 500 питань MamayLM перевершує Claude 3.7 і генерує десь на рівні з GPT-5-mini в плані лінгвістичної якості тексту. До речі, оцінював Gemini. ⠒⠍⢉⢂⠥⢆⠊
🪙 Враховуючи, що модель мультимодальна, можна перетворювати зображення в текст (OCR) чи розшифровувати рукописи;
🪙 Ваш власний ШІ-бро, раджу оцей системний промт;
🪙 Якщо ваше прізвище починається на «Ф», а закінчується на «едоров» — то це файна заміна Gemini 2.0 Flash у чат-боті Дії, щоб не платити Google за API;
🪙 Ну і якщо ви просто фанат open source LLM, то це та ж Gemma 3, але трохи краще.
Ледь не забув посилання на моделі, у LMStudio просто вбийте MamayLM-Gemma-3 ☕️
ооо донат на збір (лишилося 60 498.25)
Вийшла MamayLM v1.0 — модель на базі Gemma 3, натренована на датасеті Kobza (писав про нього туточки). Gemma обрали, бо базова модель і так добре знає українську, тож якщо трохи допилити, то взагалі буде бомба 💣
Модель краще за будь-яку іншу знає нашу історію та культуру, а також файно вирішує українське ЗНО — на бенчмарку, який нещодавно вірусився, MamayLM упевнено обходить майже всі опенсорсні моделі, навіть з більшою кількістю параметрів. Що правда, коли справа доходить до чогось більшого, ніж просто текст (а ще й зображення/формули) Qwen все ще вище 😞
Є дві версії: 4b та 12b. Квантизована версія 12b на диво шустра — на MacBook Pro з M3 видає ~11 токенів на секунду.
Ви певно спитаєте мене: котику, ну й що робити з цією моделькою? 😱😱😱
🪙 Ідеальний перекладач у парі англійська-українська і назад. Особливо враховуючи підтримку документів у LMStudio;
🪙 Якщо ви працюєте з текстом (о, це я): на наборі з 500 питань MamayLM перевершує Claude 3.7 і генерує десь на рівні з GPT-5-mini в плані лінгвістичної якості тексту. До речі, оцінював Gemini. ⠒⠍⢉⢂⠥⢆⠊
🪙 Враховуючи, що модель мультимодальна, можна перетворювати зображення в текст (OCR) чи розшифровувати рукописи;
🪙 Ваш власний ШІ-бро, раджу оцей системний промт;
🪙 Якщо ваше прізвище починається на «Ф», а закінчується на «едоров» — то це файна заміна Gemini 2.0 Flash у чат-боті Дії, щоб не платити Google за API;
🪙 Ну і якщо ви просто фанат open source LLM, то це та ж Gemma 3, але трохи краще.
Ледь не забув посилання на моделі, у LMStudio просто вбийте MamayLM-Gemma-3 ☕️
ооо донат на збір (лишилося 60 498.25)