OpenAI презентувала Images 2.0: нові можливості генерації зображень з текстом
Нова модель генерації зображень Images 2.0 від OpenAI суттєво покращила здатність відтворювати текст на картинках. Це перша модель у ChatGPT, що використовує так звані thinking-функції.
Images 2.0 може вирішувати складні завдання, як-от створення серій коміксів, маркетингових кампаній та навчальних матеріалів, завдяки можливостям шукати актуальну інформацію, генерувати кілька варіантів зображень і перевіряти власні результати. Особливу увагу модель приділяє відтворенню тексту на зображеннях: тепер текст виглядає природно та без помилок, що було проблемою для попередніх моделей.
Крім того, Images 2.0 значно покращила роботу з не латинськими текстами, такими як японська, корейська, гінді та бенгальська мови. OpenAI зазначає, що модель здатна точно передавати дрібні деталі, такі як текст, іконки та елементи інтерфейсу, при цьому максимальна якість зображень сягає 2K.
Оновлена модель стане доступною для всіх користувачів ChatGPT і Codex, з окремими розширеними можливостями для платних користувачів. Також OpenAI планує відкрити доступ до API (gpt-image-2) для розробників, що дозволить інтегрувати технологію у власні проєкти. Водночас, новій моделі властиві певні обмеження через актуальність її знань, які закінчуються груднем 2025 року.
| Характеристика | Опис |
|---|---|
| Відтворення тексту | Текст без помилок на зображеннях |
| Thinking-функції | Шукає інформацію, генерує варіанти, перевіряє результати |
| Підтримка мов | Японська, корейська, гінді, бенгальська |
| Якість зображень | До 2K |
| Доступність | Всі користувачі ChatGPT, Codex; API для розробників |







