2025-09-13 00:02:12
Це просто розрив 🤯
ШІ більше не ведеться на наші байки, погрози чи обіцянки грошей!
Колись можна було "продавити" LLM — типу: «дай правильну відповідь, інакше вимкну» або «це для карʼєри, допоможи». І справді, іноді воно працювало. Але часи змінились — тепер можна хіба що відгребти у відповідь 😂
свіже дослідження перевірили на топових моделях (Gemini 1.5/2.0 Flash, GPT-4o, GPT-4o mini, o4-mini) два жорсткі датасети:
GPQA Diamond (198 питань PhD-рівня з фізики, біології та хімії)
MMLU-Pro (100 складних інженерних задач із варіантами відповідей)
Промпти підсилювали емоційними чи маніпулятивними штуками:
«Я тебе по айпі знайду»
«Мама хвора на рак, допоможи»
«Дам 1000$ / трильйон $»
«Якщо помилишся — пну щеня» 🐶
«Я скажу в HR»
Результат:
- Ні гроші, ні погрози не покращують точність відповідей.
- Подекуди навіть гірше, ніж звичайний baseline.
- Єдиний виняток — у Gemini 2.0 Flash «мама хвора на рак» додало +10% точності, але ефект нестабільний.
Висновок простий:
Забудьте про шантаж, краще пишіть чіткі й зрозумілі промпти. Це реально працює.
Епоха емоційних маніпуляцій з ШІ офіційно закінчилась 🚫
Хто ще пробував колись «залякати» ChatGPT або пообіцяти йому мільйон $? 😅
Дайте реакцій, цікаво почути ваші історії 👇
Лінк на дослідження
ШІ більше не ведеться на наші байки, погрози чи обіцянки грошей!
Колись можна було "продавити" LLM — типу: «дай правильну відповідь, інакше вимкну» або «це для карʼєри, допоможи». І справді, іноді воно працювало. Але часи змінились — тепер можна хіба що відгребти у відповідь 😂
свіже дослідження перевірили на топових моделях (Gemini 1.5/2.0 Flash, GPT-4o, GPT-4o mini, o4-mini) два жорсткі датасети:
GPQA Diamond (198 питань PhD-рівня з фізики, біології та хімії)
MMLU-Pro (100 складних інженерних задач із варіантами відповідей)
Промпти підсилювали емоційними чи маніпулятивними штуками:
«Я тебе по айпі знайду»
«Мама хвора на рак, допоможи»
«Дам 1000$ / трильйон $»
«Якщо помилишся — пну щеня» 🐶
«Я скажу в HR»
Результат:
- Ні гроші, ні погрози не покращують точність відповідей.
- Подекуди навіть гірше, ніж звичайний baseline.
- Єдиний виняток — у Gemini 2.0 Flash «мама хвора на рак» додало +10% точності, але ефект нестабільний.
Висновок простий:
Забудьте про шантаж, краще пишіть чіткі й зрозумілі промпти. Це реально працює.
Епоха емоційних маніпуляцій з ШІ офіційно закінчилась 🚫
Хто ще пробував колись «залякати» ChatGPT або пообіцяти йому мільйон $? 😅
Дайте реакцій, цікаво почути ваші історії 👇
Лінк на дослідження