14 Июня 2024 Spark_news 276 0 В избр. Сохранено

FABULA AI добавила в экосистему версию Stable Diffusion 3.0

Нейросеть для генерации изображений с 2 млрд параметров бесплатна для некоммерческого использования в чат-бот телеграм FABULA AI.

Stable Diffusion 3.0 значительно улучшила качество изображений и способность понимать подсказку (prompt), которая может стать значительно сложнее, например, генерация по запросу: «Зеленый куб на котором стоит красный шар с попугаем, окруженный по обе стороны котами» покажет действительно запрашиваемый результат.

Разработчики Stable Diffusion 3.0 изменили архитектуру модели. Во первых вместо UNET используется трансформер. Такие изменения сильно отразятся на качестве изображения и его мелких деталях.
В отличии от старых моделей, здесь используется 3 текстовых энкодера, которые позволяют более грамотно понимать промты и определять наличие текстового запроса в нем, что позволяет рисовать на изображениях текст.
Сейчас модель хороша, но все же сыровата. Обычно Stable Diffusion доводят до совершенства генеративные модели для решения разного рода прикладных задач генерации изображения. И новая архитектура SD3 будет являться отличной почвой для экспериментов.
А также особенностью данной модели стала возможность генерировать текст (правда пока только на английском), причем явно встроенных в композицию изображения с помощью подсказки,

— прокомментировал Али Оздиев — основатель Fabula AI, международного сервиса для создания медиа-контента с помощью ИИ, ведущий поставщик нейросетей для широкой аудитории и бизнеса.

В избр. Сохранено