2025-09-27 12:02:10
Порція вечірніх цікавинок)
Компанія Meta представила нову LLM-модель для розробки програмного забезпечення під назвою Code World Model (CWM). Стверджується, що вона здатна передбачати поведінку програми до її запуску, у тому числі виявляти ризик зациклювання.
Code World Model навчена на 120 мільйонах запусків Python-коду, з фіксацією покрокових перетворень змінних та стану системи. Для цього команда Meta створила понад 35 тисяч виконуваних Docker-контейнерів. Це дозволило CWM освоїти як синтаксис, так і семантику мов програмування.
По бенчмарках CWM демонструє відносно високі результати: 65,8% на SWE-bench Verified (вирішення реальних помилок у коді), 68,6% на LiveCodeBench, 96,6% на Math-500 і 76% на аналізі на AIME 2024. Виконуючи аналіз складності алгоритмів, на тесті BigOBench вона посіла друге місце в прогнозуванні тимчасової складності.
А ми з вами на сьогодні прощаємося 🙌
До зустрічі завтра!
Бережіть себе! 💙💛
Компанія Meta представила нову LLM-модель для розробки програмного забезпечення під назвою Code World Model (CWM). Стверджується, що вона здатна передбачати поведінку програми до її запуску, у тому числі виявляти ризик зациклювання.
Code World Model навчена на 120 мільйонах запусків Python-коду, з фіксацією покрокових перетворень змінних та стану системи. Для цього команда Meta створила понад 35 тисяч виконуваних Docker-контейнерів. Це дозволило CWM освоїти як синтаксис, так і семантику мов програмування.
По бенчмарках CWM демонструє відносно високі результати: 65,8% на SWE-bench Verified (вирішення реальних помилок у коді), 68,6% на LiveCodeBench, 96,6% на Math-500 і 76% на аналізі на AIME 2024. Виконуючи аналіз складності алгоритмів, на тесті BigOBench вона посіла друге місце в прогнозуванні тимчасової складності.
А ми з вами на сьогодні прощаємося 🙌
До зустрічі завтра!
Бережіть себе! 💙💛