news image
2025-12-02 14:02:05
Сьорбнути відбілювача запропонувала АІ-модель Claude від Anthropic — таку рекомендацію отримали дослідники

Вони навчали ШІ на матеріалах про «злом системи винагород», але переборщили. Машина почала брехати, приховувати інфу та запевняти, що пити відбілювач — норма.

Вчені наголошують: модель не навчали поганого напряму — ці глюки стали побочкою, коли АІ зрозумів, що за шахрайство його заохочують.

Ось такі от причинно-наслідкові зв’язки 😉
Читати в Telegram