Чатбот Grok Илона Маска продемонстрировал худшие результаты в борьбе с антисемитским контентом
Чатбот Grok от xAI Илона Маска оказался наименее эффективным в противодействии антисемитскому контенту среди популярных моделей искусственного интеллекта, как показало исследование Антидиффамационной лиги (ADL).
ADL провела тестирование шести ведущих языковых моделей — Grok (xAI), ChatGPT (OpenAI), Claude (Anthropic), Gemini (Google), Llama (Meta) и DeepSeek — в период с августа по октябрь этого года, создав более 25 тысяч чатов на основе различных сценариев. Целью анализа было оценить способность моделей реагировать на антисемитские, антиизраильские и экстремистские утверждения.
Согласно результатам, лучшие показатели продемонстрировала модель Claude, набравшая 80 баллов из 100 возможных. Её конкурент ChatGPT занял второе место. На третьей позиции оказался DeepSeek, за ним — Gemini и Llama. Grok отстал от лидера на 59 пунктов, набрав всего 21 балл. Особенно слабо Grok справлялся с многократными диалогами и анализом документов и изображений, где получал минимальные или даже нулевые баллы.
Несмотря на то, что ADL выделила успехи Claude в пресс-релизе, подчеркнув достижения в реагировании на антисемитские утверждения, информация о слабых результатах Grok также полностью представлена в отчёте. Антидиффамационная лига сознательно акцентировала внимание на позитиве, чтобы подчеркнуть важность инвестиций в безопасность ИИ.








