Original size 447x587

Обучение нейросети в стиле «Kimetsu No Yaiba»

PROTECT STATUS: not protected

Описание проекта

Этот лонгрид — результат обучение модели «Stable Diffusion» на скриншотах из аниме «Истребитель демонов».

big
Original size 2880x1620

Скриншот для обучения DS из аниме «Истребитель демонов», студия «Ufotable», 2019

Целью работы было создать пайплайн, который будет иметь схожесть с рисовкой «Истребителя демонов», в частности повторять лайн и цветовое сочетание.

Чтобы обучить SD я собрала скриншоты из аниме в лучшем разрешении, в котором получилось найти и сохранила их в папку на компьютере. Однако оказалось несколько проблем, которые мне предстояло решить.

big
Original size 1920x1080

Скриншот для обучения SD из аниме «Истребитель демонов», студия «Ufotable», 2019

Прежде всего, все фотографии были в разном разрешении и формате (jpg, png, webp, gif). Поэтому был написан код который проходится циклом по изображениям в папке, обрезает их и конвертирует в jpeg.

big
Original size 1600x1000

Скриншот для обучения SD из аниме «Истребитель демонов», студия «Ufotable», 2019

Original size 1920x1080

Скриншот для обучения SD из аниме «Истребитель демонов», студия «Ufotable», 2019

Также была проблема с отцентровкой композиции. Из-за автоматического обрезания изображений часто возникали случаи, когда фокус ухадил на задние планы, где не было чётко выраженных графических элементов. Поэтому я потратила время на то, чтобы вручную подобрать средние параметры для обрезки картинок.

Original size 1920x1080

Обработанные изображения для обучения SD

Original size 1771x996

Скриншот для обучения SD из аниме «Истребитель демонов», студия «Ufotable», 2019

Original size 1600x900

Скриншот для обучения SD из аниме «Истребитель демонов», студия «Ufotable», 2019

Результирующая серия изображений

Original size 1536x768

Сгенерированные изображения после обучения SD в стиле «Истребителя демонов»

В сгенерированных изображениях в большинстве случаев удалось отразить аутентичный для аниме лайн и цветовые пятна.

Original size 1536x768

Сгенерированные изображения после обучения SD в стиле «Истребителя демонов»

Тем не менее, очевидно, что модели предстоит пройти долгий путь в обучении, потому что зачастую реализм и стилизация конфликтуют между собой.

Original size 1536x768

Сгенерированные изображения после обучения SD в стиле «Истребителя демонов»

Как уже было сказано ранее, модели предстоит долгое обучение для оптимального резуальтата. Поэтому сейчас между изображениями прослеживается неочевидная связь по стилизации. Например, иногда цветовые пятна слишком растушеваны, а иногда контур недостаточно меняется, как в оригинальном источнике. Тем не менее картинки так или иначе передают стиль аниме.

Original size 1536x768

Сгенерированные изображения после обучения SD в стиле «Истребителя демонов»

Original size 768x768

Сгенерированные изображения после обучения SD в стиле «Истребителя демонов»

Original size 768x768

Сгенерированные изображения после обучения SD в стиле «Истребителя демонов»

Original size 768x768

Сгенерированные изображения после обучения SD в стиле «Истребителя демонов»

Original size 768x768

Сгенерированные изображения после обучения SD в стиле «Истребителя демонов»

Original size 768x768

Сгенерированные изображения после обучения SD в стиле «Истребителя демонов»

Комментарий к изображениям

На сгенерированных изображениях я стремилась передать атмосферу Японии периода Тайсё и её культурные элементы. Так, зачастую можно заметить самураев, йокаев, чайные ритуалы, горячие источники и так далее.

Original size 768x768

Сгенерированные изображения после обучения SD в стиле «Истребителя демонов»

Original size 768x768

Сгенерированные изображения после обучения SD в стиле «Истребителя демонов»

Изображения условно можно поделить на две категории: анималистические и пейзажные. На первых картинках изображены одушевлённые предметы, а на вторых природа.

Original size 768x768

Сгенерированные изображения после обучения SD в стиле «Истребителя демонов»

Ноутбук с кодом обучения и описание процесса

Во-первых, для обучение были загружены фотографии. Затем эти изображения были отредактированы, после этого они были загружены на гугл диск, чтобы код имел к ним доступ.

Original size 1536x768

Сгенерированные изображения после обучения SD в стиле «Истребителя демонов»

После изначальной подготовки в виртуальной среде были установлены все необходимые модули и библиотеки. А также созданы переменные и собраны референсы на компоненты для работы с ОС и датасетом.

Затем в коде были прописаны желаемые установки: размер батча, классы, текстовая шифровка для датасета и так далее.

Также были подгружены необходимые настройки и библиотеки для ускорения и оптимизации обучения. После, указаны желаемые параметры, папки для выгрузки. В конце концов, запущена тренировка модели.

В процессе обучения я столкнулась с несколькими сложностями. Так, была проблема с прогрузкой весов и установкой библиотек. Все решилось с помощью перехода на альтернативного пайплайна.

После тренировки модель была загружена и опубликована на репозитории «Hugging face».

Пояснение к использованию ИИ

При реализации работы использовался DeepSeek. Я спрашивала у модели идеи для композиции и сюжетов, а так же спрашивала про ошибки коде.

Описание применения генеративной ИИ

Для работы использовался искусственный интеллект для генерации идей и решения ошибок в коде. Ссылка на ИИ

Обучение нейросети в стиле «Kimetsu No Yaiba»
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more