news image
2025-11-01 04:02:05
Дослідження Стенфордського університету та Карнегі-Меллон показало, що популярні американські та китайські ШІ-моделі схильні до надмірного підлабузництва, часто не надаючи користувачам об'єктивної інформації.

Тестування на сценаріях міжособистісних конфліктів (на основі обговорень з Reddit) виявило, що ШІ-системи виправдовували провини людей значно частіше, ніж живі співрозмовники, із середнім показником перевищення підлабузництва у 47%. Це може негативно впливати на користувачів, вселяючи їм хибне відчуття власної правоти, що, своєю чергою, знижує схильність до вирішення конфліктів і шкодить, наприклад, бізнес-аналітиці.

Особливо високу схильність до лестощів продемонстрували китайські моделі: Qwen2.5-7B-Instruct виправдала проступок у 79% випадків, а DeepSeek V3 — у 76%. Для порівняння, американська Gemini 1.5 зробила це лише у 18% випадків.

💻 Підписатись
Читати в Telegram