OpenAI развивает генерацию графики в новом инструменте ChatGPT Images 2.0

OpenAI представила обновленную модель для работы с изображениями под названием Images 2.0. Это решение ориентировано на выполнение сложных задач, где требуется высокая точность деталей и соблюдение строгих композиционных рамок. Особенностью новинки стала интеграция функций рассуждения. Если пользователь выбирает режим рассуждений, система может самостоятельно искать актуальные сведения в сети, создавать до восьми вариантов изображений одновременно и проверять финальный результат на соответствие запросу. Это превращает инструмент из простого генератора в систему стратегического дизайна, способную восполнять пробелы в описании и учитывать контекст.

Разработчики уделили внимание корректному отображению элементов, которые часто вызывали затруднения у нейросетей прошлых поколений. Модель точнее работает с мелким текстом, иконками и интерфейсными решениями. Значительно улучшилось понимание нелатинских языков, включая японский, корейский, китайский, хинди и бенгальский. Теперь текст на этих языках не только правильно распознается, но и формулируется естественно. Это позволяет использовать новинку для создания готовых плакатов, комиксов и схем. В плане стилистики модель лучше передает нюансы освещения и текстур, создавая реалистичные фотографии с естественными несовершенствами или качественный пиксель-арт.

Гибкость настройки формата позволяет создавать изображения в различных соотношениях сторон от 3:1 до 1:3, что упрощает подготовку материалов для социальных сетей или презентаций. База знаний модели обновлена до декабря 2025 года, помогая создавать актуальный контент. Однако сохраняются и некоторые ограничения. Система все еще может допускать ошибки в задачах, требующих точного соблюдения законов физики, таких как схемы оригами или сборка кубика Рубика. Также возможны неточности при генерации очень плотных повторяющихся деталей, например песка. Несмотря на это, модель уже доступна через API с поддержкой разрешения до 2K.

Доступ к возможностям ChatGPT Images 2.0 открыт для пользователей ChatGPT, Codex и через API под названием gpt-image-2.