Четверг, 18 июня, 2026
15.4 C
Киев

Анализ «мышления» ChatGPT: OpenAI изучила, как контролировать чатбота, какие выводы.

OpenAI исследует "прозрачность мышления" искусственного интеллекта для улучшения безопасности

OpenAI обнародовала новое исследование, которое анализирует способность контролировать и понимать ход рассуждений искусственного интеллекта (ИИ), в частности через его промежуточные логические шаги — так называемый chain-of-thought.

Исследование призвано оценить, насколько эффективным является наблюдение за внутренними процессами мышления моделей. В OpenAI подчеркивают, что такой подход является более результативным для выявления ошибок или опасного поведения, чем анализ только конечных ответов. Несмотря на предыдущие непонимания относительно того, сохраняется ли "прозрачность мышления" при увеличении масштабов обучения моделей, исследователи предложили новый метод оценки.

Система оценивания включает три типа тестов: оценку вмешательств, оценку процессов и оценку результатов. Например, система оценивает, можно ли понять, почему модель изменила поведение, видны ли конкретные логические шаги и можно ли предсказать проблемное поведение из рассуждений модели.

Основные выводы исследования показывают, что увеличение объема рассуждений во время ответа модели улучшает возможность выявления рисков. Наблюдение за цепочкой мыслей оказалось более эффективным, чем анализ только действий или финальных ответов. Хотя размеры текущих моделей не снижают прозрачность мышления, увеличение объемов в будущем может создать новые вызовы.

Также было исследовано, что меньшие модели с большим объемом рассуждений могут оказаться более безопасными, хотя и требуют больших вычислительных ресурсов — это так называемый "налог на контролируемость". Дополнительные уточняющие вопросы после ответа модели помогают лучше выявлять скрытые мотивы и решения.

В OpenAI подчеркивают, что с развитием ИИ растет сложность обеспечения прямого человеческого контроля. Поэтому масштабируемые методы надзора остаются критически важными для безопасного использования мощных моделей в важных сферах.

Популярне цього тижня

Британия и Япония планируют инвестиционное соглашение на 18 млрд фунтов — СМИ

Япония инвестирует 9 млрд фунтов в британские ветроэлектростанции: подробности...

В парламенте оценили работу БЭБ в направлении детенизации экономики.

Бюро экономической безопасности под прицелом: депутаты недовольны отчетом о...

Польша вложила $11 млн в ElevenLabs и получила долю в ИИ-стартапе.

Польша инвестирует $11 млн в стартап ElevenLabs, чтобы стать...

Правительство внедряет долгосрочные контракты на рынке электроэнергии

Кабмин запускает долгосрочные контракты на электроэнергию для бизнеса: что...

Теми

Британия и Япония планируют инвестиционное соглашение на 18 млрд фунтов — СМИ

Япония инвестирует 9 млрд фунтов в британские ветроэлектростанции: подробности...

В парламенте оценили работу БЭБ в направлении детенизации экономики.

Бюро экономической безопасности под прицелом: депутаты недовольны отчетом о...

Польша вложила $11 млн в ElevenLabs и получила долю в ИИ-стартапе.

Польша инвестирует $11 млн в стартап ElevenLabs, чтобы стать...

Правительство внедряет долгосрочные контракты на рынке электроэнергии

Кабмин запускает долгосрочные контракты на электроэнергию для бизнеса: что...

Ограничения на использование ИИ вводят в компаниях из-за стремительного роста расходов

Компании ограничивают использование искусственного интеллекта из-за растущих затрат Искусственный интеллект...

Нефть подешевела из-за новостей с Ближнего Востока.

Цены на нефть рухнули на фоне перспективы мирного соглашения...

Исследование показало, что ИИ от Mistral неэффективно распознает российскую дезинформацию

ИИ Mistral: Особенности работы с российской дезинформацией Недавнее исследование показало...

Схожі статті

Популярні категорії

«Дія.City Invest» стремится стать первым в Украине зарегистрированным венчурным фондом, —...

Украинское правительство запускает «Дія.City Invest» для развития венчурного рынка Правительство Украины презентовало новую инициативу «Дія.City Invest», которая должна облегчить создание и регистрацию венчурных фондов в...

Нидерланды заказали 600 000 дронов у украинских компаний для оборонных целей

Нидерланды заказали 600 000 украинских дронов для поддержки ВСУ Нидерланды подписали соглашения с украинскими производителями на поставку 600 000 дронов для усиления обороноспособности Украины. Контракты...

Украинский опыт в киберзащите: создание возможностей для заработка

Украина как международный центр кибербезопасности: новые достижения и вызовы Украина имеет потенциал стать мировым лидером в сфере кибербезопасности благодаря своему уникальному киберопыту, полученному во время...

Дания предоставит украинским военным спутниковые терминалы для связи

Дания предоставит Украине спутниковые услуги через Европейское оборонное агентство Дания впервые предоставляет Украине спутниковые услуги европейского производства, которые осуществляются через Европейское оборонное агентство (EDA). Это...

Израильская компания Xtend, которая поставляет дроны ВСУ, получила $30 млн на...

Xtend привлек $30 млн для расширения производства дронов в США Израильский стартап Xtend, известный своими дронами, привлек $30 млн инвестиций для расширения производства в Соединенных...

Продуктовый менеджмент в автомобильной отрасли: опыт и специфика работы в Stellantis

Stellantis инвестирует в цифровые инновации: как продукты меняют автоиндустрию Автомобильные цифровые продукты превращаются из простых функций в неотъемлемые элементы машин, меняя жизнь миллионов. Марина Деундяк, старший...