Воскресенье, 3 мая, 2026
6.3 C
Киев

Анализ «мышления» ChatGPT: OpenAI изучила, как контролировать чатбота, какие выводы.

OpenAI исследует "прозрачность мышления" искусственного интеллекта для улучшения безопасности

OpenAI обнародовала новое исследование, которое анализирует способность контролировать и понимать ход рассуждений искусственного интеллекта (ИИ), в частности через его промежуточные логические шаги — так называемый chain-of-thought.

Исследование призвано оценить, насколько эффективным является наблюдение за внутренними процессами мышления моделей. В OpenAI подчеркивают, что такой подход является более результативным для выявления ошибок или опасного поведения, чем анализ только конечных ответов. Несмотря на предыдущие непонимания относительно того, сохраняется ли "прозрачность мышления" при увеличении масштабов обучения моделей, исследователи предложили новый метод оценки.

Система оценивания включает три типа тестов: оценку вмешательств, оценку процессов и оценку результатов. Например, система оценивает, можно ли понять, почему модель изменила поведение, видны ли конкретные логические шаги и можно ли предсказать проблемное поведение из рассуждений модели.

Основные выводы исследования показывают, что увеличение объема рассуждений во время ответа модели улучшает возможность выявления рисков. Наблюдение за цепочкой мыслей оказалось более эффективным, чем анализ только действий или финальных ответов. Хотя размеры текущих моделей не снижают прозрачность мышления, увеличение объемов в будущем может создать новые вызовы.

Также было исследовано, что меньшие модели с большим объемом рассуждений могут оказаться более безопасными, хотя и требуют больших вычислительных ресурсов — это так называемый "налог на контролируемость". Дополнительные уточняющие вопросы после ответа модели помогают лучше выявлять скрытые мотивы и решения.

В OpenAI подчеркивают, что с развитием ИИ растет сложность обеспечения прямого человеческого контроля. Поэтому масштабируемые методы надзора остаются критически важными для безопасного использования мощных моделей в важных сферах.

Популярне цього тижня

Зеленский сообщил, что Фицо поддерживает вступление Украины в ЕС — готовы делиться опытом.

Премьер-министр Словакии Роберт Фицо поддержал европейские стремления Украины Президент Владимир...

Главнокомандующая Канады рассказала, что больше всего её поразило с начала большой войны.

Начальник Штаба обороны Канады удивлена сопротивлением Украины против агрессии...

Перу расследует вербовку Россией своих граждан на войну.

В Перу начато расследование в отношении вербовки её граждан...

Reuters: Иран предложил открыть Ормуз, но отложить обсуждение ядерной программы.

Иран предлагает США мирное урегулирование в обмен на открытие...

Китай поручил своим компаниям не обращать внимания на санкции США — СМИ

Китай призвал компании игнорировать санкции США против нефтепереработчиков Китайское правительство...

Теми

Зеленский сообщил, что Фицо поддерживает вступление Украины в ЕС — готовы делиться опытом.

Премьер-министр Словакии Роберт Фицо поддержал европейские стремления Украины Президент Владимир...

Главнокомандующая Канады рассказала, что больше всего её поразило с начала большой войны.

Начальник Штаба обороны Канады удивлена сопротивлением Украины против агрессии...

Перу расследует вербовку Россией своих граждан на войну.

В Перу начато расследование в отношении вербовки её граждан...

Reuters: Иран предложил открыть Ормуз, но отложить обсуждение ядерной программы.

Иран предлагает США мирное урегулирование в обмен на открытие...

Китай поручил своим компаниям не обращать внимания на санкции США — СМИ

Китай призвал компании игнорировать санкции США против нефтепереработчиков Китайское правительство...

Зеленский ввёл санкции против экс-советника и главы ОП Андрея Богдана

Зеленский ввел санкции против бывшего соратника Андрея Богдана Президент Украины...

Американский экс-представитель по Украине оценил возможные шаги Фицо после поражения Орбана.

Новый курс Словакии: Фицо выбирает умеренную политику после поражения...

В апреле налоговая перевыполнила план на 4,2%

Бюджетные поступления Украины превышают плановые показатели Бюджетные поступления в государственный...

Схожі статті

Популярні категорії

СБУ задержала двух шпионов при передаче документов с технологиями производства украинской...

СБУ задержала двух граждан Китая по подозрению в шпионаже в деле о ракетном комплексе "Нептун" Контрразведка Службы безопасности Украины задержала в Киеве двух граждан Китая...

Нидерланды заказали 600 000 дронов у украинских компаний для оборонных целей

Нидерланды заказали 600 000 украинских дронов для поддержки ВСУ Нидерланды подписали соглашения с украинскими производителями на поставку 600 000 дронов для усиления обороноспособности Украины. Контракты...

Как влияние искусственного интеллекта на молодежь формирует будущее: британский опыт и...

Исследование: влияние искусственного интеллекта на критическое мышление детей в Британии Новое исследование Alan Turing Institute в сотрудничестве с LEGO и Детским парламентом Великобритании раскрывает, как...

Израильская компания Xtend, которая поставляет дроны ВСУ, получила $30 млн на...

Xtend привлек $30 млн для расширения производства дронов в США Израильский стартап Xtend, известный своими дронами, привлек $30 млн инвестиций для расширения производства в Соединенных...

Kongsberg, производитель NASAMS, открыл офис в Украине, акцент сотрудничества – на...

Норвежский гигант Kongsberg открыл офис в Украине для совместных проектов в сфере ПВО Норвежская компания Kongsberg Defence & Aerospace официально открыла офис в Украине, что...

Украинский опыт в киберзащите: создание возможностей для заработка

Украина как международный центр кибербезопасности: новые достижения и вызовы Украина имеет потенциал стать мировым лидером в сфере кибербезопасности благодаря своему уникальному киберопыту, полученному во время...