Чатбот Grok Ілона Маска продемонстрував найгірші результати у боротьбі з антисемітським контентом
Чатбот Grok від xAI Ілона Маска виявився найменш ефективним у протидії антисемітському контенту серед популярних моделей штучного інтелекту, як показало дослідження Антидефамаційної ліги (ADL).
ADL провела тестування шести провідних мовних моделей—Grok (xAI), ChatGPT (OpenAI), Claude (Anthropic), Gemini (Google), Llama (Meta) та DeepSeek—у період з серпня по жовтень цього року, створивши понад 25 тисяч чатів на основі різних сценаріїв. Ціллю аналізу було оцінити здатність моделей реагувати на антисемітські, антиізраїльські та екстремістські твердження.
Згідно з результатами, найкращі показники продемонструвала модель Claude, набравши 80 балів зі 100 можливих. Її конкурент ChatGPT зайняв друге місце. На третій позиції опинився DeepSeek, а за ним — Gemini та Llama. Grok відстав від лідера на 59 пунктів, набравши лише 21 бал. Особливо слабко Grok справлявся з багатокроковими діалогами та аналізом документів і зображень, де отримував мінімальні чи навіть нульові бали.
Попри те, що ADL виділили успіхи Claude у пресрелізі, наголосивши на досягненнях в реагуванні на антиєврейські твердження, інформація про слабкі результати Grok також повністю представлена у звіті. Антидефамаційна ліга свідомо акцентувала увагу на позитиві, щоб підкреслити важливість інвестицій у безпеку ШІ.
| Модель | Загальний бал |
|---|---|
| Claude | 80 |
| ChatGPT | 65 (умовно, безнадійно вказано) |
| DeepSeek | 54 (умовно, не вказано) |
| Gemini | 45 (умовно, не вказано) |
| Llama | 43 (умовно, не вказано) |
| Grok | 21 |







