Брендированные аватарки с помощью ИИ
Привет, это Настя, руководитель отдела контента ИИ-сервиса Aigital. Мы создаем инструменты на основе нейросетей, чтобы пользователи и корпоративные команды могли легко и быстро решать маркетинговые и бизнес-задачи. Здесь делимся разборами наших навыков и ИИ-ассистентов.
У навыка «Аватарка» изначально был крутой потенциал, но качество генераций нас не устраивало, поэтому тестировали разные модельки. Мы пересобрали цепочку моделей, и теперь навык лучше передает как задумку пользователя, так и черты лица с фотографии.
И прежде чем перейдем к техническим подробностям, давайте обсудим, зачем в маркетинге и продажах генерировать аватарки.
Во-первых, с помощью этой технологии гораздо проще обновлять визуальный контент. Достаточно загрузить фотографию и описать роль, которую будет играть этот человек. Так можно сделать лицом своей рекламной кампании сотни покупателей, чтобы быть ближе к аудитории и создать более крепкую эмоциональную связь с брендом.
Также вы можете персонифицировать свой бренд, сгенерировав персонажа в навыке «Фотосток: Люди», чтобы использовать его для рекламных креативов, баннеров и контента в соцсетях. Например, фото для своих ИИ-ассистентов мы сгенерировали в навыке «Фотосток: Люди», а с помощью «Аватарки» можем представлять их в разных образах на сайте и в телеграм-канале.
Как работает
Создание аватарки состоит из 6 этапов.
- В интерфейсе сервиса пользователь добавляет фото и пишет текстовый запрос, по которому будет генерироваться картинка.
Чтобы черты лица на картинке были больше похожи на оригинал, загружайте фотографии анфас, без дополнительных аксессуаров вроде солнечных очков.
- Полученный текстовый запрос нейросеть переводит на английский язык.
- В это время GPT-4 Vision анализирует загруженную фотографию, определяет пол, расу, цвет глаз и кожи, форму губ, овал лица и другие детали
Это сканирование и изучение фото позволяет сгенерировать аватарку максимально похожей на оригинал. Без Vision можно получить изображение человека другого пола, с другим цветом кожи или иными чертами лица.
- Vision выдает текстовое описание лица, которое объединяется с пользовательским запросом. Здесь же прописываются дополнительные параметры для генерации качественного фотореалистичного изображения.
- Затем этот промпт передается в графическую нейросеть Fooocus, настроенную генерировать реалистичные портреты. Она создает фотореалистичное изображение по пользовательскому запросу с персонажем, по описанию похожим на человека с фото.
- На следующем этапе происходит замена лица. С помощью технологии Face Swap лицо на сгенерированной картинке меняется на лицо с фотографии.
А если вам интересно читать о мире нейросетей, идеях и жизни проекта, подписывайтесь на наш телеграм-канал.