OpenAI представила Images 2.0: новые возможности генерации изображений с текстом
Новая модель генерации изображений Images 2.0 от OpenAI существенно улучшила способность воспроизводить текст на картинках. Это первая модель в ChatGPT, использующая так называемые thinking-функции.
Images 2.0 может решать сложные задачи, такие как создание серий комиксов, маркетинговых кампаний и учебных материалов, благодаря возможностям поиска актуальной информации, генерации нескольких вариантов изображений и проверки собственных результатов. Особое внимание модель уделяет воспроизведению текста на изображениях: теперь текст выглядит естественно и без ошибок, что было проблемой для предыдущих моделей.
Кроме того, Images 2.0 значительно улучшила работу с нелатинскими текстами, такими как японский, корейский, хинди и бенгальский языки. OpenAI отмечает, что модель способна точно передавать мелкие детали, такие как текст, иконки и элементы интерфейса, при этом максимальное качество изображений достигает 2K.
Обновленная модель станет доступной для всех пользователей ChatGPT и Codex, с отдельными расширенными возможностями для платных пользователей. Также OpenAI планирует открыть доступ к API (gpt-image-2) для разработчиков, что позволит интегрировать технологию в собственные проекты. В то же время новой модели свойственны определенные ограничения из-за актуальности ее знаний, которые заканчиваются декабрем 2025 года.
Характеристика Описание
Воспроизведение текста Текст без ошибок на изображениях
Thinking-функции Ищет информацию, генерирует варианты, проверяет результаты
Поддержка языков Японский, корейский, хинди, бенгальский
Качество изображений До 2K
Доступность Все пользователи ChatGPT, Codex; API для разработчиков








