
2024-08-01 12:00:01
Мій бухгалтер може спати спокійно: дослідники перевірили, як LLM справляються з типовими фінансовими задачами 😂
Вони зробили бенчмарк з реальними кейсами малого та середнього бізнесу за роки діяльності — рахунки, розрахунки, перерахунки 🤑
С задачками за перші місяці LLM пораються, але далі контекст починає викидувати приколи: помилки множаться, ШІ не можуть звести дебет з кредитом, вигадують перекази. Іншими словами: роблять що завгодно, аби суми зійшлися.
Наприклад, коли в Claude не сходилися числа, він просто шукав в історії транзакції на необхідну суму й записував їх повторно 😂
Сайт дуже красивий, раджу зайти потицяти.
ооо нейромережеве | Монобаза
Вони зробили бенчмарк з реальними кейсами малого та середнього бізнесу за роки діяльності — рахунки, розрахунки, перерахунки 🤑
С задачками за перші місяці LLM пораються, але далі контекст починає викидувати приколи: помилки множаться, ШІ не можуть звести дебет з кредитом, вигадують перекази. Іншими словами: роблять що завгодно, аби суми зійшлися.
Наприклад, коли в Claude не сходилися числа, він просто шукав в історії транзакції на необхідну суму й записував їх повторно 😂
Сайт дуже красивий, раджу зайти потицяти.
ооо нейромережеве | Монобаза