Добавить в избранное

Брэд Питт останется без работы: Alibaba выпустила нейросеть для генерации фильмов и видеомонтажа

Китайский гигант Alibaba представил нейросеть Wan2.7-Video, которая переводит ИИ из разряда инструментов для создания коротких роликов в категорию полноценных кинорежиссеров. Если раньше нейросети генерировали разрозненные кадры, то новая система управляет всем съемочным процессом, от раскадровки и подбора актеров до сложного монтажа и синхронизации губ под измененный сценарий. 

Фото: кадр из видео @AlibabaCloud

Технология позволяет пользователю превратиться из простого исполнителя в постановщика, способного создавать работы «директорского» уровня с помощью обычных текстовых команд на обычном языке, без кода и других ухищрений. 

Фото: кадр из видео @AlibabaCloud



Система Wan2.7-Video объединяет в себе сразу четыре модели, которые отвечают за генерацию видео из текста, картинок и других видеоматериалов, а также за глубокое редактирование готового контента. В отличие от предыдущих итераций ИИ, эта модель решает главную проблему нейросетевого кино — отсутствие логической последовательности между кадрами. 

Фото: кадр из видео @AlibabaCloud

Теперь персонажи сохраняют свою внешность, голос и уникальные черты лица на протяжении всего фильма, а нейросеть способна удерживать консистентность до пяти различных героев одновременно в рамках сложных повествовательных линий.

Фото: кадр из видео @AlibabaCloud

Особое внимание разработчики уделили «умной» режиссуре: нейросеть понимает команды по управлению камерой, включая сложные пролеты дронов от первого лица, орбитальные съемки на 360 градусов и динамическое освещение. 

Фото: кадр из видео @AlibabaCloud

Пользователь может словами изменить погоду в кадре, переписать диалог (система сама подстроит мимику и движение губ) или задать финальный кадр, к которому нейросеть плавно подведет сюжет без резких склеек. 

Фото: кадр из видео @AlibabaCloud

На фоне таких возможностей голливудские звезды и огромные съемочные группы действительно начинают выглядеть как дорогой анахронизм, поскольку Wan2.7 позволяет за считанные минуты делать то, на что раньше уходили месяцы постпроизводства и миллионы долларов.

Параллельно с видеомоделью Alibaba обновила и генератор изображений Wan2.7-Image, который теперь выдает картинки с фотографической точностью и идеальной передачей цветов по конкретным кодам брендов. Нейросеть научилась детально прорисовывать анатомию, включая структуру костей и форму глаз, а также без ошибок рендерить сложные академические тексты, таблицы и формулы на 12 языках. 

Сочетание этих инструментов дает создателям контента возможность выпускать высокобюджетные проекты, не выходя из дома, что ставит под вопрос будущее традиционных киностудий.