FABULA AI добавила в экосистему версию Stable Diffusion 3.0
Нейросеть для генерации изображений с 2 млрд параметров бесплатна для некоммерческого использования в чат-бот телеграм FABULA AI.
Stable Diffusion 3.0 значительно улучшила качество изображений и способность понимать подсказку (prompt), которая может стать значительно сложнее, например, генерация по запросу: «Зеленый куб на котором стоит красный шар с попугаем, окруженный по обе стороны котами» покажет действительно запрашиваемый результат.
Разработчики Stable Diffusion 3.0 изменили архитектуру модели. Во первых вместо UNET используется трансформер. Такие изменения сильно отразятся на качестве изображения и его мелких деталях.
В отличии от старых моделей, здесь используется 3 текстовых энкодера, которые позволяют более грамотно понимать промты и определять наличие текстового запроса в нем, что позволяет рисовать на изображениях текст.
Сейчас модель хороша, но все же сыровата. Обычно Stable Diffusion доводят до совершенства генеративные модели для решения разного рода прикладных задач генерации изображения. И новая архитектура SD3 будет являться отличной почвой для экспериментов.
А также особенностью данной модели стала возможность генерировать текст (правда пока только на английском), причем явно встроенных в композицию изображения с помощью подсказки,
0
В избр.
Сохранено