Google представила две модели искусственного интеллекта, которые призваны ускорить и удешевить процесс создания и редактирования мультимедийного контента. Инструменты вышли в рамках платформ Google AI Studio, Gemini API и Gemini Enterprise Agent Platform. Разработчики могут использовать их в связке, генерируя изображения, а затем преобразуя их в видеопоследовательности с сохранением общего контекста и истории сессии.
Модель Nano Banana 2 Lite ориентирована на быструю генерацию картинок при минимальных затратах. Скорость создания изображений по текстовому описанию составляет 4 секунды, что подходит для быстрого прототипирования. В линейке также присутствуют базовая Nano Banana 2 и профессиональная Nano Banana Pro для более сложных задач. Предыдущее поколение под названием Nano Banana рекомендуется заменить на облегченную версию. Инструмент Nano Banana 2 Lite также интегрируется в потребительские сервисы Google, включая поиск, NotebookLM, Google Photos и Google Flow.
Вторая новинка, Gemini Omni Flash, предназначена для создания и редактирования видео с помощью текстовых команд, изображений или видеофрагментов. Модель поддерживает синхронизацию графики с действиями в кадре, использует общие знания ИИ для построения логики сцен и позволяет вносить до трех последовательных правок в рамках одной сессии. На текущем этапе инструмент поддерживает создание роликов длительностью 10 секунд и имеет ряд ограничений по сохранению стабильности персонажей при панорамировании.
