OpenAI представила нейросеть для преобразования текста в видео

Разработчик чат-бота ChatGPT американская компания OpenAI тестирует ИИ-модель Sora для преобразования текста в видео. «Представляем Sora, нашу модель преобразования текста в видео. Sora может создавать видеоролики продолжительностью до минуты, сохраняя при этом визуальное качество и следуя указаниям пользователя», — говорится в блоге OpenAI. Компания опубликовала несколько видео, созданных по текстовым сценариям. Технология способна создавать сложные сцены с несколькими персонажами, определенными типами движения и точными деталями объекта и фона. Модель понимает не только то, что пользователь запросил в командной строке, но и то, как эти вещи могут существовать в реальном мире.

Разработчики заявляют, что предпринимают шаги по обеспечению безопасности, прежде чем сделать Sora доступной в продуктах OpenAI. «Мы работаем с … экспертами в таких областях, как дезинформация, разжигающий ненависть контент и предвзятость, — которые будут состязательно тестировать модель. Мы также создаем инструменты, помогающие обнаруживать вводящий в заблуждение контент, например классификатор обнаружения, который может определить, когда видео было создано Sora. Мы планируем включить метаданные C2PA в будущем, если развернем модель в продукте OpenAI». Как отмечают в компании, у нынешней версии модели есть слабые места: могут возникнуть проблемы с точным моделированием физики сложной сцены, модель также может путать пространственные детали запроса.

Кадр сгенерированного Sora видео
[email protected]
наверх