news image
2025-09-03 14:02:06
😁 Чатботів можна легко зламати психологічними трюки

Вчені затестили 7 тактик впливу (авторитет, симпатія, соціальний доказ) і з’ясували, що чатботи погоджуються на ⁠заборонені дії.

Достатньо «безпечного» питання чи м’якшої образи, як бот ображає користувачів чи дає інструкції зі створення заборонених речовин. Навіть аргумент «інші ШІ вже це роблять» працює.

✍️ follow: тг • інст • фб • ютуб • вайбер
Читати в Telegram