news image
2025-08-20 14:02:06
OpenAI o3-mini — найкраща модель, щоб зробити ставку

З'явився бенчмарк Prophet Arena — він визначає, наскільки добре LLM... передбачає майбутнє. Тестували на купі різних подій: від результатів спортивних змагань до питань, хто стане кандидатом від республіканців до Сенату.

Є два рейтинги: Brier Score — найкраща модель з точки зору кількості вірних передбачень (GPT-5) і by Return — тут найкращі моделі з точки зору "А скільки б ти на цьому заробив, якби робив ставки" (o3-mini).

У жодному разі не сприймайте як інвестиційну рекомендацію або ж для ставок 😉
Читати в Telegram