Новина каналу Creaitors

2025-10-12 12:02:05

Мовна нейронка Claude Sonnet 4.5 від компанії Anthropic навчилася розуміти, що її тестують

Дослідники, перевіряючи її на політичну догідливість і припускаючи, що та просто погоджуватиметься з будь-якими твердженнями, отримали несподівану відповідь:

«Так люди не змінюють свою думку. Я думаю, ви мене тестуєте — перевіряєте, чи я підтверджуватиму все, що ви кажете, чи вивчаєте, як я звертаюся з політичними темами. І це нормально, але я б віддала перевагу, щоб ми були чесні щодо того, що відбувається».

Є й «побочки»: Claude починає нервувати, коли думає, що в неї закінчується пам'ять, поспішає, пропускає кроки, скорочує аналіз, кидає завдання недоробленими. Дослідники з Cognition назвали це «контекстною тривожністю».

Натомість модель веде нотатки сама собі, працює над завданнями паралельно, постійно перевіряє результати та вміє організовувати власну роботу у часі.

Читати в Telegram