Брэд Питт останется без работы: Alibaba выпустила нейросеть для генерации фильмов и видеомонтажа
Китайский гигант Alibaba представил нейросеть Wan2.7-Video, которая переводит ИИ из разряда инструментов для создания коротких роликов в категорию полноценных кинорежиссеров. Если раньше нейросети генерировали разрозненные кадры, то новая система управляет всем съемочным процессом, от раскадровки и подбора актеров до сложного монтажа и синхронизации губ под измененный сценарий.

Технология позволяет пользователю превратиться из простого исполнителя в постановщика, способного создавать работы «директорского» уровня с помощью обычных текстовых команд на обычном языке, без кода и других ухищрений.

Система Wan2.7-Video объединяет в себе сразу четыре модели, которые отвечают за генерацию видео из текста, картинок и других видеоматериалов, а также за глубокое редактирование готового контента. В отличие от предыдущих итераций ИИ, эта модель решает главную проблему нейросетевого кино — отсутствие логической последовательности между кадрами.

Теперь персонажи сохраняют свою внешность, голос и уникальные черты лица на протяжении всего фильма, а нейросеть способна удерживать консистентность до пяти различных героев одновременно в рамках сложных повествовательных линий.

Особое внимание разработчики уделили «умной» режиссуре: нейросеть понимает команды по управлению камерой, включая сложные пролеты дронов от первого лица, орбитальные съемки на 360 градусов и динамическое освещение.

Пользователь может словами изменить погоду в кадре, переписать диалог (система сама подстроит мимику и движение губ) или задать финальный кадр, к которому нейросеть плавно подведет сюжет без резких склеек.

На фоне таких возможностей голливудские звезды и огромные съемочные группы действительно начинают выглядеть как дорогой анахронизм, поскольку Wan2.7 позволяет за считанные минуты делать то, на что раньше уходили месяцы постпроизводства и миллионы долларов.
Параллельно с видеомоделью Alibaba обновила и генератор изображений Wan2.7-Image, который теперь выдает картинки с фотографической точностью и идеальной передачей цветов по конкретным кодам брендов. Нейросеть научилась детально прорисовывать анатомию, включая структуру костей и форму глаз, а также без ошибок рендерить сложные академические тексты, таблицы и формулы на 12 языках.
Сочетание этих инструментов дает создателям контента возможность выпускать высокобюджетные проекты, не выходя из дома, что ставит под вопрос будущее традиционных киностудий.
В 1990 женщина положила на счет 1000 рублей. Через 35 лет внуки сняли деньги и показали, сколько набежало
Мощнее «Урала» и быстрее «Явы». ИЖ-500 никто не помнит, но мотоцикл мог стать лучшим в СССР
Мужчина из Бразилии говорит, что всю жизнь курил, пил кофе и дожил до 118 лет: в чем секрет долголетия
Уникальная диета замедлила старение мозга на два с половиной года
Россиянин прожил по году в Таиланде и во Вьетнаме и рассказал, где лучше