15 марта на ютьюбе появился ролик, в котором персонажи фильмов по книгам о Гарри Поттере стали моделями на несуществующем модном показе. Часть героев произносит свои коронные, но слегка измененные фразы — и делает это голосами, знакомыми поклонникам франшизы. Все сопровождают вспышки фотокамер и типичная для модных шоу электронная музыка. Видео быстро стало популярным, разошлось по твиттеру и другим соцсетям. Сейчас только на ютьюбе у него больше семи миллионов просмотров.
«Ты — Balenciaga, Гарри», — говорит Хагрид. Несмотря на кожаное пальто в эстетике испанского бренда и непривычную укладку волос, лесника все еще легко узнать. Крайне серьезные Гарри, Рон и Гермиона позируют в не менее модных образах. Северус Снегг будто на уроке зельеварения интересуется: «Поттер, в чем разница между H&M и Balenciaga?» «Добра и зла не существует. Есть только Balenciaga», — угрожающе заявляет Волан-де-Морт.
Harry Potter by Balenciaga
demonflyingfox
Аналогичные клипы — далеко не только с Гарри Поттером — начали появляться на ютьюбе с середины марта. Все они длятся около минуты, персонажи популярных фильмов или сериалов в образах моделей произносят знакомые фразы, на фоне звучит музыка, как на модных показах.
В большинстве вирусных клипов герои похожи на моделей с шоу Balenciaga — почему именно на них, неизвестно. Возможно, просто так повелось с самого первого ролика. Сам модный дом Balenciaga никак не связан с авторами видео и пока не комментировал их, но опрошенные Forbes юристы утверждают, что у компании накопились основания для обращения в суд. В этой же публикации Forbes напоминает, что Balenciaga неоднократно запускал вирусные кампании и промоакции, поэтому может с пониманием отнестись к бесплатной рекламе.
Автор первого нейросетевого видео «Harry Potter by Balenciaga», с которого начался тренд, — блогер под ником demonflyingfox. Он не раскрывает журналистам настоящее имя, живет в Берлине, работает в фотоиндустрии, а также исследует возможности искусственного интеллекта. demonflyingfox не создавал все подобные ролики, но именно ему принадлежат два самых реалистичных и популярных — про Гарри Поттера и героев сериала «Во все тяжкие».
Вот несколько примеров видео по мотивам показов Balenciaga.
Breaking Bad by Balenciaga
demonflyingfox
Lord of the Rings by Balenciaga
demonflyingfox
Star Wars by Balenciaga
Abandoned Films
Такие вирусные видео — это скорее «ожившие картинки», полностью сгенерированные нейросетями (не одной, а сразу несколькими). А много этих роликов потому, что сделать их не так сложно, как может показаться на первый взгляд.
Как создать свой «модельный» ИИ-клип — и не обязательно с Гарри Поттером или Balenciaga
Чтобы сделать аналогичный клип, можно пройти по пути блогера demonflyingfox и воспользоваться несколькими нейросетевыми сервисами — чат-ботом ChatGPT, фотогенератором Midjourney, генератором голоса ElevenLabs и сервисом D-ID для создания видео.
Первый шаг: ChatGPT
1. Открываем новый диалог с ChatGPT и просим сгенерировать несколько имен самых популярных персонажей, например, фильма или сериала. Чем популярнее был проект — тем лучше будет результат при дальнейшей обработке нейросетями. В начале можно обойтись и без чат-бота, но он сэкономит уйму времени.
2. Получив список имен, спрашиваем ChatGPT, как они могут выглядеть и во что могут быть одеты, к примеру, на модном показе того или иного бренда.
Вот пример текстового запроса на английском языке:
Now, act as a N (подставьте Balenciaga или любой другой бренд, — прим. «Медузы») fashion designer with 20 years of experience. I want you to dress each of these N (количество персонажей) characters in a unique N (название бренда) piece for a runway show. Just write the name of the character and the piece. Remember, itʼs a N (год) fashion show.
3. Учим ChatGPT понимать промты для Midjourney — текстовые описания картинок, которые мы будем генерировать в дальнейшем. Для этого пишем в чат-бот следующее сообщение про одного из персонажей:
N (год) screengrab of N (male, female) model N (имя персонажа) wearing a grotesque N (цвет предмета гардероба и название бренда) dress, fashion movie scene, N (название бренда) commercial —ar 3:2 —v 5′. Just say «Yes» if you understand.
Чтобы не составлять аналогичные текстовые запросы для всех персонажей, просим помощи у ChatGPT:
I want you to rewrite the prompt but for every character, with the clothes you chose for them. Remember to write the prompt exactly as I pasted it, with the same format and parameters. Only change the gender of the model, the name of the character, and the description of the clothing. Do you understand? Please ask if you need more information.
Второй шаг: Midjourney
1. Получив от ChatGPT список текстовых запросов (промтов), переходим в Midjourney, чтобы на их основе сгенерировать изображения с персонажами. О том, как пользоваться фотогенератором, «Медуза» подробно рассказывала в этом материале.
2. В одном из чатов на discord-сервере Midjourney по очереди отправляем промты. Когда нейросеть сгенерирует четыре изображения, выберите одно или несколько из тех, что нравятся вам больше всего, и загрузите их себе на устройство. Повторите с каждым промтом.
Третий шаг: YouTube и конвертер
1. Чтобы сгенерировать голос, максимально похожий на настоящий, нейросети нужен источник, на котором можно научиться. Для этого подойдет ютьюб-видео, в котором разговаривает исполняющий роль персонажа актер (например, играющий Гарри Поттера Дэниэл Рэдклифф). Разумеется, важно, чтобы это был не диалог, а монолог.
2. Вырежьте аудио с помощью любого из подходящих вам сервисов-конвертеров, которые преобразуют ютьюб-ролики в mp3-файлы.
Повторите это со всеми персонажами.
Четвертый шаг: ElevenLabs
1. Переходим в сервис ElevenLabs (учтите, что он пока работает в бета-версии), с помощью которого сгенерируем персонажам голоса. Необходимо добавить заранее вырезанную аудиодорожку с голосом героя и придумать текст, который он будет произносить.
Чаще всего авторы таких роликов использовали коронные фразы персонажей, но добавляли в них что-нибудь про Balenciaga. Запустите генерацию аудио, подождите результата и скачайте его.
Повторите операцию со всеми персонажами, которые будут говорить в вашем ролике.
Пятый шаг: D-ID и CapCut
К финальной стадии у нас есть сгенерированные фотографии персонажей и голоса их нейросетевых «клонов». Теперь открываем сервис D-ID, с помощью которого создадим анимированный клип.
1. D-ID предлагает инструкцию для начинающих, но можно справиться и без нее. По очереди загружаем каждое изображение, сгенерированное Midjourney.
2. Выбираем, будет персонаж молчать или говорить. Если вы хотите, чтобы ваш герой произносил фразу, которую вы создали с помощью ElevenLabs, загрузите аудиофайл в открывшемся меню справа. Там же можно выбрать продолжительность анимации в видео.
3. Проделайте то же самое со всеми персонажами, а затем склейте получившиеся видео. Для этого можно использовать бесплатный сервис CapCut.
4. Для создания фотовспышек можно использовать эффекты light и flashes для переходов в видео. На эти же моменты нужно дополнительно наложить эффект camera shutter.
5. Чтобы сделать видео максимально реалистичным, можно добавить динамический зум (вот как это сделать), но это не обязательно.
6. В самом конце выбираем фоновую музыку и добавляем ее в ролик в приложении CapCut. Можно остановиться на том самом треке, который используется в большинстве роликов, а можно найти другой. В любом случае нужно будет скачать трек себе на устройство. Затем сгенерируйте готовый ролик в CapCut.
Все, после этого ваш ролик должен быть готов! Если вам удобнее, можете воспользоваться инструкцией в видеоформате
Инструкция по созданию таких видео
PromptJungle
ChatGPT
Чтобы переписываться с чат-ботом OpenAI, нужно зарегистрироваться на сайте. Хотя ChatGPT поддерживает русский язык, в России, как и в нескольких других странах, продукты OpenAI не работают. При регистрации компания просит указать актуальный телефон и не принимает российские номера. Последняя версия доступна только платным подписчикам (20 долларов в месяц без учета налогов, российская карта не подойдет), но в этом конкретном случае GPT-4 не обязателен.
Подставьте Balenciaga или любой другой бренд.
Midjourney
Бесплатно воспользоваться Midjourney нельзя — платный аккаунт обязателен. Российские карты не принимаются. Есть три варианта подписки — за 10, 30 и 60 долларов ежемесячно. Пакеты отличаются количеством серверного времени, доступного клиентам, и количеством изображений, которые можно сгенерировать. При оплате сразу на год вперед цены ниже — 8, 24 и 48 долларов в месяц.
ElevenLabs
Бесплатная версия сервиса сильно ограничена в возможностях, позволяет сгенерировать не более трех голосов. Платные опции начинаются от пяти долларов в месяц (10 голосов в месяц) — этого хватит для этой конкретной задачи. Сервис доступен только на английском языке. Самая дорогая подписка предназначена для бизнеса — 330 долларов в месяц.
D-ID
Сервисом можно воспользоваться бесплатно: пробная версия на 14 дней позволяет сгенерировать до пяти минут видеоматериала. Самая базовая подписка обойдется в 5,99 доллара в месяц.
Важно!
При загрузке на ютьюб своего ролика с чужой музыкой стоит помнить, что его могут удалить за нарушение авторских прав. Получить официальный доступ к разным трекам можно, например, здесь.