2024-08-01 12:00:01
Мій бухгалтер може спати спокійно: дослідники перевірили, як LLM справляються з типовими фінансовими задачами 😂

Вони зробили бенчмарк з реальними кейсами малого та середнього бізнесу за роки діяльності — рахунки, розрахунки, перерахунки 🤑

С задачками за перші місяці LLM пораються, але далі контекст починає викидувати приколи: помилки множаться, ШІ не можуть звести дебет з кредитом, вигадують перекази. Іншими словами: роблять що завгодно, аби суми зійшлися.

Наприклад, коли в Claude не сходилися числа, він просто шукав в історії транзакції на необхідну суму й записував їх повторно 😂

Сайт дуже красивий, раджу зайти потицяти.

ооо нейромережеве | Монобаза
Читати в Telegram