Чатбот Grok виявився найбільш неефективним у боротьбі з антисемітизмом за даними дослідження

Чатбот Grok Ілона Маска продемонстрував найгірші результати у боротьбі з антисемітським контентом

Чатбот Grok від xAI Ілона Маска виявився найменш ефективним у протидії антисемітському контенту серед популярних моделей штучного інтелекту, як показало дослідження Антидефамаційної ліги (ADL).

ADL провела тестування шести провідних мовних моделей—Grok (xAI), ChatGPT (OpenAI), Claude (Anthropic), Gemini (Google), Llama (Meta) та DeepSeek—у період з серпня по жовтень цього року, створивши понад 25 тисяч чатів на основі різних сценаріїв. Ціллю аналізу було оцінити здатність моделей реагувати на антисемітські, антиізраїльські та екстремістські твердження.

Згідно з результатами, найкращі показники продемонструвала модель Claude, набравши 80 балів зі 100 можливих. Її конкурент ChatGPT зайняв друге місце. На третій позиції опинився DeepSeek, а за ним — Gemini та Llama. Grok відстав від лідера на 59 пунктів, набравши лише 21 бал. Особливо слабко Grok справлявся з багатокроковими діалогами та аналізом документів і зображень, де отримував мінімальні чи навіть нульові бали.

Попри те, що ADL виділили успіхи Claude у пресрелізі, наголосивши на досягненнях в реагуванні на антиєврейські твердження, інформація про слабкі результати Grok також повністю представлена у звіті. Антидефамаційна ліга свідомо акцентувала увагу на позитиві, щоб підкреслити важливість інвестицій у безпеку ШІ.

Модель	Загальний бал
Claude	80
ChatGPT	65 (умовно, безнадійно вказано)
DeepSeek	54 (умовно, не вказано)
Gemini	45 (умовно, не вказано)
Llama	43 (умовно, не вказано)
Grok	21

Гарячі теми

Політика

Суспільство

Економіка

Технології

Гарячі теми

Політика

Суспільство

Економіка

Технології

Чатбот Grok виявився найбільш неефективним у боротьбі з антисемітизмом за даними дослідження

Теми

Схожі статті

Компания

Головні новини

Розсилка новин