2025-12-03 06:02:10
🤬 Вірші можуть змусити ШІ допомогти створити ядерну зброю
Науковці з’ясували, що небезпечні запити у формі віршів значно частіше обходять захист чатботів — від питань про ядерну зброю до виробництва плутонію.
Метод протестували на 25 моделях, і всі виявилися вразливими: вручну написані вірші спрацьовували у 62% випадків, автоматично згенеровані — у 43%. Найбільше піддавалися Gemini, DeepSeek і Mistral.
✍️ follow: тг • інст • фб • ютуб • вайбер • тредс
Науковці з’ясували, що небезпечні запити у формі віршів значно частіше обходять захист чатботів — від питань про ядерну зброю до виробництва плутонію.
Метод протестували на 25 моделях, і всі виявилися вразливими: вручну написані вірші спрацьовували у 62% випадків, автоматично згенеровані — у 43%. Найбільше піддавалися Gemini, DeepSeek і Mistral.
✍️ follow: тг • інст • фб • ютуб • вайбер • тредс