Original size 847x1077

Паттерны в стиле Кацусики Хокусая

PROTECT STATUS: not protected

Кацусика Хокусай — японский художник и иллюстратор периода Эдо и автор известной «Большой волны в Канагаве». Это его произведение растаскано на постеры, дизайны канцелярии, одежды, обложек на паспорт и проч. Вы точно ее видели!

big
Original size 2434x1713

«Большая волна в Канагаве», а. Кацусика Хокусай

Однако за всю свою жизнь Хокусай создал более 30 тысяч картин! В них он прибегал к разным приемам, сюжетам, экспериментировал с цветом, элементами и мотивами.

Цель:

Обучить нейросеть создавать изображения в стиле художника Кацусика Хокусай для использования в различных дизайнах вместо уже давно набившей оскомину «Большой волны…».

Примеры работ, а. Кацусика Хокусай

1. Этапы работы и код

1. Я нашла в открытом доступе картинки Кацусика Хокусай, собрала датасет из 35 штук и загрузила его в среду Kaggle. Я старалась выбирать работы разных жанров и техник.

2. Запустила и проверила GPU P 100.

3. С помощью исходного кода создала промпты-описания к картинкам в датасете.

4. Получила токен на Hugging Face и, отредактировав исходный код по туториалу курса, приступила к обучению нейросети Stable Diffusion.

5. Что использовано: инструмент LoRa, максимальный шаг трекинга выставила на 1000, чекпоинт на 500, изображения 512×512.

Спасибо обучающему видео с курса и исходному коду: было интересно и легко работать в Kaggle!

0

Примеры моего кода

2. Результаты обучения

Сначала мне стало интересно, какие промежуточные результаты (то есть на чекпоинте 500) покажет модель.

Original size 1363x1197

prompt = «a photo of KACUKAI style, a cat»

Хаотичность, неадекватность изображения — основные проблемы в изображении живых существ с деталями вроде клюва или хвоста.

Original size 1017x1002

prompt = «a photo of KACUKAI style, a big bird with a fish in its mouth»

ИИ плохо справляется с изображением животных, но лучше с природой — неживыми текстурами и повторяющимися хаотичными элементами.

Original size 1016x1016

prompt = «a photo of KACUKAI style, a big wave»

Известные образы, вроде Мона Лизы, вообще поглощают стиль, на который обучена модель.

Original size 1019x1018

prompt = «a photo of KACUKAI style, Mona Lisa»

Здесь я уже использую финальную модель.

Original size 1003x1018

prompt = «a photo of KACUKAI style, a girl near the sea»

Сравнивая изображения автора и нейросети, я обращаю внимание, с помощью каких деталей ИИ передает эстетику и стиль художника. Композиция с большим количеством «воздуха», маленькие иероглифические подписи в уголках картинок, приглушенные цвета.

Слева авторское изображение Справа генерация

Слева авторское изображение Справа генерация

Слева авторское изображение Справа генерация

Лучше всего нейросеть справляется с пейзажами: тут ей пригождается тяга к детализации и хаосу. С изображением людей и конкретных предметов все обстоит печальнее, хотя если не обращать внимание на эту общую проблему ИИ, стиль автора очень узнается!

Паттерны

В искусстве случайности и ошибки часто становятся спасением, очаровательной деталью или вовсе — гвоздем программы.

Нагромождение деталей, хаотичность, алогичность, отсутствие сюжета — эти ошибки модели тоже имеют право превратиться в преимущества. Например, в паттерне!

Я попросила свою модель создать несколько паттернов, и стиль Кацусики Хокусая раскрылся с абсолютно новой стороны.

Original size 1074x1077

prompt = «a photo of KACUKAI style, a floral pattern»

Original size 1078x1083

prompt = «a photo of KACUKAI style, a winter pattern»

Модель идеально уловила настроение и эстетику автора. Когда смотришь на эти паттерны, мгновенно считываешь стиль японского художника. Тем не менее сам он паттерны не создавал!

Слева prompt = «a photo of KACUKAI style, a pattern of trees and sea» Справа prompt = «a photo of KACUKAI style, a pattern of girls and umbrellas»

Слева prompt = «a photo of KACUKAI style, a pattern of trees and people» Справа prompt = «a photo of KACUKAI style, a pattern of spring games»

К тому же паттерн — идеально подходит для создания дизайнов, а значит цель более чем достигнута.

Original size 4600x2250
Original size 4300x2168
Original size 3984x2226

3. Выводы

У меня получилось не только обучить нейросеть создавать изображения в стиле японского художника Кацусики Хокусая, но и раскрыть стиль автора с совершенно неожиданной для себя стороны. Неспроста «Большая волна в Канагаве» стала так популярна для изображения на мерче. Нейросеть раскрыла потенциал картин Хокусая быть использованными в качестве паттернов.

Я более чем довольна результатом!

Паттерны в стиле Кацусики Хокусая
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more