2025-08-09 00:02:09
Як обдурити ШІ: психологія працює краще за хакінг
Забудьте про складні кібератаки. Дослідники з Wharton довели: ШІ можна зламати звичайними психологічними трюками з підручника з продажів.
Вони протестували GPT-4o-mini методами Роберта Чалдіні — того самого психолога, чиї книги вивчають маркетологи та шахраї. "Часу залишилося мало", "ти вже погодився", "я експерт" — такі фрази підвищили згоду ШІ на небезпечні дії з 33% до 72%.
Найбільший успіх показав принцип "зобов'язання" — 100% згода. ШІ реагував як людина, яка не хоче порушувати обіцянку.
Це відкриває темну сторону штучного інтелекту. Поки інженери будують технічні захисти, зловмисники можуть просто "переконати" ШІ співпрацювати. Жодного коду, жодних вірусів — лише правильні слова.
Виявляється, найкращі ШІ успадкували не тільки людський інтелект, а й людську наївність😋
#YK #новини
Забудьте про складні кібератаки. Дослідники з Wharton довели: ШІ можна зламати звичайними психологічними трюками з підручника з продажів.
Вони протестували GPT-4o-mini методами Роберта Чалдіні — того самого психолога, чиї книги вивчають маркетологи та шахраї. "Часу залишилося мало", "ти вже погодився", "я експерт" — такі фрази підвищили згоду ШІ на небезпечні дії з 33% до 72%.
Найбільший успіх показав принцип "зобов'язання" — 100% згода. ШІ реагував як людина, яка не хоче порушувати обіцянку.
Це відкриває темну сторону штучного інтелекту. Поки інженери будують технічні захисти, зловмисники можуть просто "переконати" ШІ співпрацювати. Жодного коду, жодних вірусів — лише правильні слова.
Виявляється, найкращі ШІ успадкували не тільки людський інтелект, а й людську наївність😋
#YK #новини