Четвер, 18 Червня, 2026
14.3 C
Kyiv

Чатбот Grok виявився найбільш неефективним у боротьбі з антисемітизмом за даними дослідження

Чатбот Grok Ілона Маска продемонстрував найгірші результати у боротьбі з антисемітським контентом

Чатбот Grok від xAI Ілона Маска виявився найменш ефективним у протидії антисемітському контенту серед популярних моделей штучного інтелекту, як показало дослідження Антидефамаційної ліги (ADL).

ADL провела тестування шести провідних мовних моделей—Grok (xAI), ChatGPT (OpenAI), Claude (Anthropic), Gemini (Google), Llama (Meta) та DeepSeek—у період з серпня по жовтень цього року, створивши понад 25 тисяч чатів на основі різних сценаріїв. Ціллю аналізу було оцінити здатність моделей реагувати на антисемітські, антиізраїльські та екстремістські твердження.

Згідно з результатами, найкращі показники продемонструвала модель Claude, набравши 80 балів зі 100 можливих. Її конкурент ChatGPT зайняв друге місце. На третій позиції опинився DeepSeek, а за ним — Gemini та Llama. Grok відстав від лідера на 59 пунктів, набравши лише 21 бал. Особливо слабко Grok справлявся з багатокроковими діалогами та аналізом документів і зображень, де отримував мінімальні чи навіть нульові бали.

Попри те, що ADL виділили успіхи Claude у пресрелізі, наголосивши на досягненнях в реагуванні на антиєврейські твердження, інформація про слабкі результати Grok також повністю представлена у звіті. Антидефамаційна ліга свідомо акцентувала увагу на позитиві, щоб підкреслити важливість інвестицій у безпеку ШІ.

Модель Загальний бал
Claude 80
ChatGPT 65 (умовно, безнадійно вказано)
DeepSeek 54 (умовно, не вказано)
Gemini 45 (умовно, не вказано)
Llama 43 (умовно, не вказано)
Grok 21

Популярне цього тижня

Британія та Японія планують інвестугоду на £18 млрд – ЗМІ

Японія інвестує 9 млрд фунтів у британські вітроелектростанції: подробиці...

У парламенті оцінили роботу БЕБ у напрямку детінізації економіки

Бюро економічної безпеки під прицілом: депутати невдоволені звітом про...

Польща вклала $11 млн в ElevenLabs і отримала частку в ШІ-стартапі

Польща інвестує $11 млн у стартап ElevenLabs, щоб стати...

Уряд впроваджує довгострокові контракти на ринку електроенергії

Кабмін запускає довгострокові контракти на електроенергію для бізнесу:...

Теми

Британія та Японія планують інвестугоду на £18 млрд – ЗМІ

Японія інвестує 9 млрд фунтів у британські вітроелектростанції: подробиці...

У парламенті оцінили роботу БЕБ у напрямку детінізації економіки

Бюро економічної безпеки під прицілом: депутати невдоволені звітом про...

Польща вклала $11 млн в ElevenLabs і отримала частку в ШІ-стартапі

Польща інвестує $11 млн у стартап ElevenLabs, щоб стати...

Уряд впроваджує довгострокові контракти на ринку електроенергії

Кабмін запускає довгострокові контракти на електроенергію для бізнесу:...

Обмеження на використання ШІ впроваджують у компаніях через стрімке зростання витрат

Компанії обмежують використання штучного інтелекту через зростаючі витрати Штучний інтелект...

Нафта подешевшала через новини з Близького Сходу

Нафтові ціни обвалилися на тлі перспективи мирної угоди між...

Дослідження виявило, що ШІ від Mistral неефективно розпізнає російську дезінформацію

ШІ Mistral: Особливості роботи з російською дезінформацією Нещодавнє дослідження...

Схожі статті

Популярні категорії

Google повідомляє, що 75% нового коду в компанії створюється штучним інтелектом

Штучний інтелект генерує 75% коду в Google Компанія Google повідомила, що наразі 75% нового коду генерується за допомогою штучного інтелекту, який потім затверджується інженерами....

OpenAI веде переговори про контракт з НАТО після угоди з Пентагоном,...

OpenAI вивчає можливість співпраці з НАТО: розгортання ШІ в некласифікованих мережах OpenAI розглядає можливість укладання контракту з НАТО на застосування своїх технологій штучного інтелекту в...

Українсько-американський стартап StackBooster здобув $100 000 фінансування від ZAS Ventures, збільшивши...

Українсько-американський стартап Stackbooster залучив $100 000 інвестицій від ZAS Ventures Stackbooster, стартап, що спеціалізується на оптимізації хмарної інфраструктури, зміцнив свої фінансові позиції, отримавши $100 000...

Євросоюз має намір розпочати запуск супутникової системи IRIS² у 2029 році

ЄС може запустити супутникову систему IRIS² на рік раніше запланованого Європейський Союз планує запустити багаторівневу супутникову систему IRIS² вже у 2029 році, на рік раніше,...

Інвестиції або азарт: як мобільні додатки розмивають кордон між ними

Торгівля через мобільні додатки: інвестування чи азартна гра? Мобільні додатки для торгівлі фінансовими інструментами дедалі більше замінюють традиційне інвестування азартною грою, про що йдеться в...

Українська компанія Vchasno Group інвестувала $1 млн у автоматизацію бізнесу Узбекистану...

Vchasno Group інвестувала $1 млн у узбекистанську платформу Hippo.uz Група українських ІТ-компаній Vchasno Group вклала $1 млн у Hippo.uz, узбекистанську платформу для автоматизації бізнес-процесів, з...