Чем нейросети DALL-E 2 и Midjourney могут быть полезны музыкантам
Содержание
Авторы
В последние месяцы в интернете много говорят о нейросетях, которые генерируют изображения по текстовым запросам. При этом отличить картинки, созданные искусственным интеллектом, от творений человека зачастую бывает сложно. Наиболее обсуждаемыми среди нейросетей стали DALL-E 2 и Midjourney: «ИМИ.Журнал» разобрался, зачем они нужны музыканту и как их использование устроено с юридической точки зрения.
Что такое Midjourney и DALL-E 2 и как ими пользоваться
Нейросеть Midjourney появилась в феврале этого года — ее создала одноименная американская компания. Чуть позже, весной, другая американская компания, OpenAI, представила вторую — усовершенствованную — версию нейросети DALL-E, впервые продемонстрированную в январе 2021-го. И Midjourney, и DALL-E 2 функционируют по общему принципу: пользователь задает как можно более конкретное текстовое описание желаемой картинки, обученная на сотнях миллионов примеров нейросеть понимает запрос и генерирует изображение.
Чтобы пользоваться DALL-E 2, потребуется оставить заявку на сайте и дождаться получения приглашения. В течение первого месяца можно бесплатно можно создать 50 изображений, далее установлен лимит в 15 бесплатных изображений в месяц. Для его превышения потребуется заплатить 15 долларов. Недавно разработчики разрешили использовать все изображения, сгенерированные на платформе, в коммерческих целях, и готовятся дать доступ к нейросети всем желающим.
В отличие от DALL-E 2, начать пользоваться Midjourney гораздо проще: для этого потребуется завести аккаунт в Discord и зайти на сайт нейросети. Если вы нажмете на Sign In with Discord, то свяжете ваш аккаунт в Discord с личной страницей на сайте: там будут храниться все ваши творения. Также вы получите доступ к галерее с работами других пользователей. Кнопка Join the Beta даст приглашение в Discord-сервер Midjourney, где и осуществляется генерация контента. Бесплатная пробная версия позволяет создать 25 картинок, также существует несколько видов платной подписки — ее стоимость варьируется от 10 до 600 долларов в месяц в зависимости от потребностей пользователя. Права на использование в коммерческих целях предоставляются только по подписке.
В интернете уже опубликованы понятные инструкции по тому, как работать в DALL-E 2 и Midjourney, а также есть статьи, которые сравнивают обе платформы. Пересказывать их кажется излишним, отметим лишь, что функционал обеих нейросетей действительно простой и с ним может справиться рядовой пользователь интернета. Из специальных навыков потребуется только базовое знание английского языка для генерации тестовых запросов, но и его вполне можно заменить использованием онлайн-переводчика.
«Особенность создания визуалов с помощью нейросетей состоит в том, что вам не нужно быть профессионалом, специально что-то программировать. И напротив — получаемые в результате изображения пугающе профессиональны и смелы с точки зрения графической мысли. Все, что от вас требуется, — сформулировать правильный текстовый запрос», — отмечает сооснователь агентства TBTBO Brand Mastering Алексей Евдокимов, активно тестирующий нейросети для создания визуала.
Зачем это нужно музыкантам
«Пока что движение набирает свои обороты, но я абсолютно уверен, что в ближайшее время мы увидим огромное количество обложек, созданных нейросетками. И совершенно точно это не ограничится только обложками. Сравнительно недавно вышел клип, собранный из сгенерированных изображений, на песню Егора Летова „Все идет по плану“. Он выглядит пугающе прекрасным. Если говорить о стилистике, то мы также ничем не ограничены. Уже сейчас появилось огромное количество специализированных подборок известных художников или иллюстраторов, чье имя можно указать в запросе и получить визуализацию в конкретном стиле», — говорит Евдокимов.
На YouTube вышел клип на песню «Биография» группы «Кровосток», также сгенерированный нейросетью.
В стримингах уже можно послушать релизы с созданными при помощи нейросети визуалами. Так, участники «Супергруппы» (в ее состав входят музыканты из групп Cruel Tie, «Ада» и Mad Pilot) недавно выпустили сингл «Просим вас не пить во дворах и на детских площадках», обложка которого сгенерирована DALL-E 2. Релиз представляет собой одну и ту же песню с разными названиями, в которых есть отсылка к геолокации каждого участника «Супергруппы».
«В случае Cruel Tie мы всегда обращались к талантливым друзьям и близким из креативного круга знакомств. Или же просили использовать в оформлении их уже опубликованные работы. Паша Жданов из „Ады“ поступал схожим образом, не считая тех случаев, когда он сам выступал дизайнером. Сейчас у нас были некоторые представления о том, что мы хотим видеть на обложке сингла, но из-за поджимающих сроков, сложности в реализации и занятости готовых помочь знакомых решили пойти экспериментальным путем и вслепую. В то время попадалось много мемов и релизов с применением технологии DALL-E 2, и мы решили: это то, что нужно. Сначала я попытался получить доступ к нейросети, но оказалось, что нужно отстоять электронную очередь. А у нас оставалось буквально два дня до сдачи сингла, поэтому мы поспрашивали по Telegram-чатам, у кого есть возможность сгенерировать для нас несколько обложек по нашим запросам, и тогда нам подсказали чат text2image. Ребята оттуда оказались очень отзывчивыми, несмотря на гигантское количество просьб помочь, и в итоге сами же увлеклись набором все более специфических текстовых запросов», — рассказывает участник «Супергруппы» и Cruel Tie Руслан Тихонов.
Обложка «Просим вас не пить во дворах и на детских площадках» выполнена в стиле детского рисунка и визуализирует сценку на лавочке с участием мужчины в форме правоохранителя. Руслан говорит, что делал запросы вида «dirty playground with no kids, four adults on the bench, one policeman, homeless dog in style of kid. Музыканты создавали в процессе и более реалистичные и «картинные» варианты, которые, по словам Тихонова, «были даже в каком-то смысле круче». «Но среди всего этого удивительного богатства выбора мы остановились на самом долбанутом варианте. Дорожим своими корнями», — отмечает Руслан.
Могут ли музыканты использовать сгенерированные нейросетями изображения
По словам Руслана Тихонова, у дистрибьютора, отгружавшего релиз в стриминги, не возникло вопросов по поводу применения такой картинки в качестве обложки альбома. Как уже отмечалось выше, разработчики DALL-E 2 разрешили использовать все изображения, сгенерированные на платформе, в коммерческих целях.
Можно ли использовать изображения, созданные нейросетями, в стримингах, в соцсетях, на афишах и на мерче музыканта, мы уточнили у партнера юридической фирмы Semenov & Pevzner Екатерины Калиничевой.
«Однозначно на этот вопрос ответить сложно, необходимо рассматривать каждый случай индивидуально. Можно выделить несколько общих положений, на которые стоит обратить внимание. Нейросетью могут генерироваться известные объекты (в том числе произведения и товарные знаки), что может нарушать права правообладателей. Соответственно, тот, кто использует такой объект в качестве обложки релиза, рискует стать нарушителем. Права на производные объекты, созданные с помощью нейросети, могут принадлежать создавшим их лицам при соблюдении определенных условий. Кроме того, платформы содержат условия использования сгенерированных объектов, которые могут изменяться в зависимости от приобретаемого тарифного плана, о чем прямо упоминается в условиях Midjournal», — объяснила Екатерина.
Мы также уточнили у Екатерины, какие запросы пользователей DALL-E 2 и Midjournal потенциально могут вызвать проблемы с точки зрения российского законодательства.
Юрист дала следующие советы:
- Не использовать как основу для генерации фотографии, иные изображения, произведения, логотипы, права на которые вам не принадлежат (например, просто взятые из интернета картинки).
- Не генерировать изображения или выбирать из предложенных искусственным интеллектом похожие на лого известных брендов.
- Внимательно читать актуальные условия лицензий платформ. Часто встречаются условия, при которых вы предоставляете платформе и другим пользователем право использовать, в том числе изменять, сгенерированные вами изображения. В таком случае не исключена ситуация, когда у кого-то еще может появиться похожая обложка релиза.
Смогут ли музыканты отказаться от услуг дизайнеров
Алексей Евдокимов из TBTBO Brand Mastering называет новую технологию «геймченджером» и говорит, что это «не просто очередное знаковое событие, а новый эпохальный виток для всей креативной индустрии».
«Безусловный плюс для артистов в том, что вам не нужно тратить много времени и средств на продакшен. Вы визуализируете вашу идею через минуту, сразу, напрямую из головы. А сеть добавляет к этому щепотку своего безумства. Получается некий новый симбиоз творческой мысли. Но при этом мы увидим настолько сильное заигрывание с технологией, что в какой-то момент из чего-то необычного, на чем сейчас артист может выделиться, это превратится во что-то абсолютно рядовое и повсеместное. Для ребят, которые ищут не только уникальное звучание, но и в целом хотят следовать по пути идентичности собственного бренда, искусственный интеллект будет не самым очевидным выбором», — рассуждает Евдокимов.
На вопрос, лишит ли массовое использование нейросетей работы дизайнеров и иллюстраторов, Алексей отвечает так: «Определенная категория дизайнеров, скорее всего, действительно прекратит существование, но пока что до этого далеко. Совершенно точно испытают проблемы очень многие иллюстраторы. В ближайшее время, конечно же, появятся ребята, которые профессионально будут генерить правильные запросы. Уже сейчас это очень тонкий инструмент. Но тут появляется другой, более актуальный момент: если нейросеть самообучается от всех запросов и модификаций, насколько все испортится или улучшится от вмешательства людей, которые понимают, как ею манипулировать?».