Суббота, 2 мая, 2026
11 C
Киев

Анализ «мышления» ChatGPT: OpenAI изучила, как контролировать чатбота, какие выводы.

OpenAI исследует "прозрачность мышления" искусственного интеллекта для улучшения безопасности

OpenAI обнародовала новое исследование, которое анализирует способность контролировать и понимать ход рассуждений искусственного интеллекта (ИИ), в частности через его промежуточные логические шаги — так называемый chain-of-thought.

Исследование призвано оценить, насколько эффективным является наблюдение за внутренними процессами мышления моделей. В OpenAI подчеркивают, что такой подход является более результативным для выявления ошибок или опасного поведения, чем анализ только конечных ответов. Несмотря на предыдущие непонимания относительно того, сохраняется ли "прозрачность мышления" при увеличении масштабов обучения моделей, исследователи предложили новый метод оценки.

Система оценивания включает три типа тестов: оценку вмешательств, оценку процессов и оценку результатов. Например, система оценивает, можно ли понять, почему модель изменила поведение, видны ли конкретные логические шаги и можно ли предсказать проблемное поведение из рассуждений модели.

Основные выводы исследования показывают, что увеличение объема рассуждений во время ответа модели улучшает возможность выявления рисков. Наблюдение за цепочкой мыслей оказалось более эффективным, чем анализ только действий или финальных ответов. Хотя размеры текущих моделей не снижают прозрачность мышления, увеличение объемов в будущем может создать новые вызовы.

Также было исследовано, что меньшие модели с большим объемом рассуждений могут оказаться более безопасными, хотя и требуют больших вычислительных ресурсов — это так называемый "налог на контролируемость". Дополнительные уточняющие вопросы после ответа модели помогают лучше выявлять скрытые мотивы и решения.

В OpenAI подчеркивают, что с развитием ИИ растет сложность обеспечения прямого человеческого контроля. Поэтому масштабируемые методы надзора остаются критически важными для безопасного использования мощных моделей в важных сферах.

Популярне цього тижня

Reuters: Иран предложил открыть Ормуз, но отложить обсуждение ядерной программы.

Иран предлагает США мирное урегулирование в обмен на открытие...

Китай поручил своим компаниям не обращать внимания на санкции США — СМИ

Китай призвал компании игнорировать санкции США против нефтепереработчиков Китайское правительство...

Зеленский ввёл санкции против экс-советника и главы ОП Андрея Богдана

Зеленский ввел санкции против бывшего соратника Андрея Богдана Президент Украины...

Американский экс-представитель по Украине оценил возможные шаги Фицо после поражения Орбана.

Новый курс Словакии: Фицо выбирает умеренную политику после поражения...

В апреле налоговая перевыполнила план на 4,2%

Бюджетные поступления Украины превышают плановые показатели Бюджетные поступления в государственный...

Теми

Reuters: Иран предложил открыть Ормуз, но отложить обсуждение ядерной программы.

Иран предлагает США мирное урегулирование в обмен на открытие...

Китай поручил своим компаниям не обращать внимания на санкции США — СМИ

Китай призвал компании игнорировать санкции США против нефтепереработчиков Китайское правительство...

Зеленский ввёл санкции против экс-советника и главы ОП Андрея Богдана

Зеленский ввел санкции против бывшего соратника Андрея Богдана Президент Украины...

Американский экс-представитель по Украине оценил возможные шаги Фицо после поражения Орбана.

Новый курс Словакии: Фицо выбирает умеренную политику после поражения...

В апреле налоговая перевыполнила план на 4,2%

Бюджетные поступления Украины превышают плановые показатели Бюджетные поступления в государственный...

Зависимость России от Китая достигла наивысшего уровня, сообщают СМИ.

Торговая зависимость России от Китая растет на фоне санкций...

Схожі статті

Популярні категорії

Инвестиционный портфель: ключевые инструменты для инвестора

Экспертиза в диверсификации инвестиций: ключевые подходы для новичков Василий Матий, CEO Smart Family Office, объясняет, как создавать диверсифицированные инвестиционные портфели с учетом различных типов активов...

"С нами сотрудничают не из жалости": как Саломе Микадзе, соосновательница IT-компании...

Саломе Микадзе: История успеха украинской предпринимательницы с грузинскими корнями Саломе Микадзе — украинская предпринимательница с грузинскими корнями, которая уже в 18 лет основала свою IT-компанию...

Нидерланды заказали 600 000 дронов у украинских компаний для оборонных целей

Нидерланды заказали 600 000 украинских дронов для поддержки ВСУ Нидерланды подписали соглашения с украинскими производителями на поставку 600 000 дронов для усиления обороноспособности Украины. Контракты...

Украина строит: Зеленский объявил об экспорте оборонных технологий за границу для...

Украина начнет экспорт оборонных технологий в Европу Президент Украины Владимир Зеленский на встрече с журналистами анонсировал начало экспорта технологий для производства оружия в Европу. Этот...

Як Telegram пов’язаний з ФСБ: журналістське розслідування виявило зв’язки з компаніями,...

Расследование: Серверы Telegram контролируются структурами, связанными с ФСБ По данным расследования российского независимого медиа «Важные истории», серверная инфраструктура мессенджера Telegram привлекает компании, связанные с Федеральной...

Укрепление воздушной защиты: украинские системы ПВО интегрируют с NASAMS

Укроборонпром и Kongsberg объединили усилия для укрепления ПВО Украины Государственный концерн «Укроборонпром» и норвежская компания Kongsberg Defence & Aerospace заключили соглашение о сотрудничестве, направленное на...