Midjourney – нейросеть, которая поменяет правила в ритейле
Шум вокруг нейросетей не утихает. Компании уже начали с их помощью создавать дизайны, копирайтинговые агентства писать тексты, и даже студенты уже были пойманы в попытках «поручить» ИИ написание дипломных работ. Нас, в первую очередь, интересует то, каким образом можно использовать умные чат-боты в реализации бизнес-процессов. Независимый эксперт по инновациям в ритейле Борис Агатов продолжает тестировать технологичные инструменты.
Недавно на отраслевом портале New Retail была опубликована моя большая статья о появившемся в конце года чат-боте ChatGPT, который преодолел раздражающее всех роботизированное общение с человеком, и по стилю изложения стал походить на приятного, умного, всеведущего собеседника. Многие оценили появление такой речевой модели, и уже назвали её «Прорывом года».
Конечно, я не смог удержаться и протестировал еще один инструмент – поисковую платформу BINGO. Некоторые проявления этого ИИ меня просто поразили.
Не менее интересный инструмент – Midjourney – появился примерно в это же время, и его также смело можно отнести к прорыву года. Midjourney позволяет по текстовому описанию создавать картинки и видео очень высокого качества.
На сегодня Midjourney создаёт наиболее качественные визуалы, хотя таких инструментов уже довольно много, наиболее известные Stable Diffusion, DALLE 2, Imagen и т.д. Ниже демонстрация того, как далеко шагнул Midjourney. Справа – его работа, слева – его собратьев по ИИ.
Я пробовал разные нейронные сети, и результат меня пока удовлетворяет только в Midjourney.
В чём основные проблемы сетей? Они довольно плохо генерируют конечности людей (появляются третьи руки, пальцев становится больше пяти, пропорции нарушены и т.д), они в принципе слабо понимают запрос. Поэтому сегодня мой рассказ будет в основном про Midjourney. Остальные нейросети я привлеку в свой обзор для сравнения, а в некоторых случаях отлично работает комплексный подход. Одна нейросеть «рубит», другая «отвозит».
НЕСКОЛЬКО ФАКТОВ О НЕЙРОННЫХ ДИФФУЗИОННЫХ СЕТЯХ:
1. Принцип создания в этих сетях такой: нейронную сеть обучили распознавать миллионы изображений (звуков, текстов и т.п.). Она их смешивает и получает уникальное изображение.
2. Нейронные сети сейчас неплохо справляются с любыми творческими задачами, будь то написание музыки или создание изображения. Сегодняшний этап их развития можно назвать начальным, потому стоит ожидать более совершенных результатов в будущем.
3. С Midjourney можно работать из России без VPN – это хорошая новость, плохая же состоит в том, что Midjourney – платный сервис.
4. В Midjourney есть возможность сгенерировать 25 изображений бесплатно, многие советуют, чтобы не платить деньги, завести новый аккаунт и снова получить лимит в 25 картинок. Если же вы предпочтёте платную подписку, то нижняя стоимость будет $8 в месяц при условии оплаты за один год. Разумеется, у россиян возникнут проблемы с оплатой картой, но и эти проблемы решаемы.
5. Midjourney работает через мессенджер Discord. Дискорд – это аналог Telegram, WhatsApp и т.п. им активно пользуются те, кто играет в компьютерные игры. В этом есть некоторая необычность, но быстро привыкаешь. В строке сообщения задаёшь команду и там же тебе выдаётся результат.
6. Midjourney очень плохо понимает русский язык. Вот вам результат одного и того же запроса на русском языке и переведённого на английский.
7. Midjourney, Stable Diffusion, Dalle – это сети, за которыми стоят крупные корпорации, и все они дружно ввели запреты на некоторые слова, чтобы нельзя было при помощи сетей генерировать порнографию, сцены насилия и другой шокирующий контент. Но как вы понимаете, в ответку им появились сети, которые именно на этом и специализируются. Это вызывает некоторые сложности даже если вы не делаете шок-контент.
К примеру, вы заходите сгенерировать изображение по запросу «бутик нижнего белья» (lingerie boutique), и вы получите сообщение, что слово lingerie (нижнее бельё) забанено, и не сможете это сделать.
8. Нейронная сеть не имеет чётких правил общения с ней, но, тем не менее, есть какие-то закономерности выстраивания фраз. Сейчас появились целые сайты и помощники, которые помогают правильно сформулировать запрос. Вот один из них. Для начала не забивайте себе голову такими сложностями, просто попробуйте общаться обычным языком и результат даже в этом случае вас удовлетворит, а потом уже переходите на новый уровень.
9. Авторские права – это самый сложный вопрос, на который ни у кого нет окончательного ответа. Изображение, которое создаётся, абсолютно уникально и скорее принадлежит вам, т.к. идею изображения сформулировали вы, но дальше начинается самое сложное – нейросеть обучалась на картинах, фотографиях, компьютерных изображения, которые были созданы людьми. Художники сейчас подают иски к создателям нейронных сетей на предмет соблюдения их авторских прав. Чем всё это закончится – неясно, т.к. ситуация, с которой судам придётся разбираться, возникла благодаря новым технологиям, и пока не имеет аналогов и прецедентов.
10. Нейронные сети развиваются семимильными шагами, и они уже довольно сильно продвинулись на пути от создания статичного изображения к подвижному. Иными словами, нейронную сеть научили воспринимать текст, как сценарий. Вот один из первых результатов такой работы текст описания выглядел так: «Плюшевый мишка плавает в океане; плюшевый мишка выбирается из воды; плюшевый мишка гуляет по пляжу; камера приближается к плюшевому мишке у костра на пляже»
Очевидно, что за созданием видео из текста кроются ещё большие возможности для ритейла. И давайте разберем живые примеры того, как Midjourney уже используется для решения практических задач.
СОЗДАНИЕ ИНТЕРЬЕРОВ МАГАЗИНОВ
Вы, к примеру, решили обновить интерьер магазина, но вам нужны идеи для этого. Вы формулируете эту идею в таком ключе: «интерьер бутика женской домашней одежды, пастельные тона, современный дизайн, площадь магазина 60 м2, высота потолков 4 м, на полу паркет елочкой, касса в центре магазина», и получаете множество вариантов.
Далее обращаетесь к компании, которая умеет работать с нейросетями, к примеру, к компании Project Line, и она вам дорабатывает эти эскизы до проекта интерьера реального магазина.
СОЗДАНИЕ МОДЕЛЕЙ ОДЕЖДЫ
Для создания описания той или иной картинки вы можете задействовать нейросеть ChatGPT, т.е. не из головы придумывать, как выглядит жакет, а поручить составить это описание другой нейронной сети.
Я задал вопрос в ChatGPT: «как должен выглядеть ультрамодный женский жакет?»
Нейросеть выдала мне ответ: «Ультрамодный жакет для женщин может иметь уникальный дизайн. Жакет, скорее всего, будет иметь привлекательный и уникальный дизайн, который отличает его от более простых стилей. Это могут быть смелые цвета, замысловатые узоры или неожиданные детали.
Высококачественные материалы: ультрамодный жакет должен быть сделан из высококачественных роскошных материалов, таких как кожа, шелк или кашемир. Эти материалы придадут жакету превосходный внешний вид.
Индивидуальный крой: жакет должен иметь индивидуальный крой, который будет одновременно льстивым и удобным, подчеркивая фигуру владельца, но не ограничивая его.
Внимание к деталям: жакет должен иметь большое внимание к деталям, таким как пуговицы, молнии и другая фурнитура, добавляющая дополнительный штрих роскоши и изысканности.
Модные стили: жакет, скорее всего, будет соответствовать текущим модным тенденциям. Это могут быть негабаритные, удлиненные стили или объемные и скульптурные формы.
Универсальность: жакет универсален, легко сочетается с разными типами одежды и его можно носить в разных случаях и ситуациях».
Я, не редактируя этот ответ от ChatGPT, отправил в Midjourney, т.е. вы можете для повышения эффективности использовать сразу два инструмента. Один помогает сформулировать запрос, а второй – генерирует изображение и получил такие результаты.
На создание таких образов я потратил едва ли больше 10 минут. Однако много времени я потратил на создание запроса, а генерация изображения занимает меньше минуты, и генерировать новые дизайны можно бесконечно долго, насколько у вас позволяет ваш тариф.
ОПТИМИЗАЦИЯ РАБОТЫ СО ЗВЁЗДАМИ
Вы, к примеру, сняли лицо бренда, с которым у вас заключён договор. Ваша компания работает по всей стране, да и задачи после съёмки могут сильно измениться. На помощь придут нейросети.
Вот пример такого проекта: вы продаёте спортивные товары и сняли звезду тенниса, допустим, Даниила Медведева.
Можно «попросить» нейросеть поменять фон, позу на фотографии и т.п. можно поместить селебрити в разные локации и фоны, тем самым максимально отработав визуальный материал, который был получен. Даниила можно отправить на пляж, на Луну, на Марс, на вулкан и в зимний сад – под любую нужную вам ситуацию. При хорошей фантазии, оригинальный контент можно использовать достаточно долго и под разные цели.
СОЗДАНИЕ ИЗОБРАЖЕНИЙ, МАРКЕТИНГОВЫХ МАТЕРИАЛОВ ДЛЯ РАЗНЫХ НАРОДОВ И НАЦИОНАЛЬНОСТЕЙ
Россия – многонациональная страна. Вы сняли модель для своих промоматериалов и при отправке, к примеру, в Якутию, Башкирию и т.п. можете придать ей черты той национальности, которая доминирует на этой территории.
Для примера я объединил своё фотографию с фотографией человека бурятской национальности.
И получившийся результат:
ЗАМЕНА СТОКОВЫХ ИЗОБРАЖЕНИЙ
При наличии такого инструмента отпадает необходимость в использовании различных фотобанков. Если вы ведёте контентный проект в ритейле в социальных сетях, на своём сайте, на маркетплейсе, то вы можете очень быстро генерировать изображение под необходимый текст.
Я сам уже активно этим пользуюсь.
Появилась новость о том, что в Санкт-Петербурге начнётся эксперимент по доставке по воздуху грузов дронами, и у меня сразу появилась идея доставки грузов на крыши торговых комплексов. Как понимаете, картинку, визуализацию того, как это может быть организовано, я моментально сделал при помощи Midjourney.
ИДЕИ ПО ОФОРМЛЕНИЮ ВИТРИН
Эти идеи завершают мой обзор, но, на самом деле, возникает ощущение, что Midjourney вот для этого и был придуман. Нейросеть практически мгновенно генерит множество идей – от простых до сложных и технологичных. Вот, к примеру, реакция ресурса на простой запрос «оформление витрин к осени». Красиво!
ВЫВОД
Способов использования нейронных сетей очень много, и стоит поразмыслить над тем, как ещё их можно использовать.
Велика вероятность того, что в будущем появятся специализированные сети, которые будут создавать только одежду или подсказывать идеи для оформления витрин, чтобы точнее удовлетворять запросы.
Мы только в самом начале этого процесса и пока есть вопросы к качеству создаваемых визуалов, но первые результаты, говорят о том, что потихоньку стирается грань между реальностью и воображением, т.к. инструменты, при помощи которых это происходит, довольно просты и стали уже доступны каждому.
Маркетинг станет ситуационным и очень индивидуальным именно благодаря таким инструментам. Так, к примеру, вы делаете рассылку по 20 тысячам адресов и каждому получателю отправляете изображение или видео, сделанное специально для него.
Или внезапно изменилась внешняя ситуация: летом пошёл снег, прилетели инопланетяне или ещё какое-то необычное событие, и у вас через пару минут может быть под рукой новый визуальный материал. И не стоит забывать, что нейронные сети также хорошо работают с музыкой и текстом.
О том, как в будущем будет выглядеть работа продавца и способ покупки товара при развитии этих технологий, я расскажу в следующей статье.
Борис Агатов, независимый эксперт по инновациям в ритейле, футуролог. Для New Retail