Original size 2480x3500

Обучение генеративной нейросети под объект

PROTECT STATUS: not protected

Концепция

Цель моего проекта — обучить нейросеть понимать и воспроизводить изображение объекта: лошадей. Для обучения используются фотографии лошадей в различных позах, ракурсах и локациях. В разделе «Исходные изображения» представлены фото, включенные в базу данных для анализа и обучения.

Исходные изображения

big
Original size 4256x2832
big
Original size 800x495

Сгенерированные изображения

big
Original size 1024x1024

A photo of TOK horse a horse running in a field of flowers

Original size 1024x1024

A photo of TOK horse a horse standing in a field with the sun setting behind it

Original size 3500x1109

Итоговая серия изображений представляет собой генерацию фотореалистичного объекта — лошадей.

Сгенерированные изображения демонстрируют успехи в имитации такого сложного объекта, как лошадь. Получилось создать фото с разными ракурсами, планами, локациями и светом. Особенно удачно нейросети удалось передать гриву, отлив шерсти, а также динамику поз лошадей, присутствующую на референсах в базе данных.

Работа с кодом

Original size 1131x590

Просмотр датасета (первые 5 изображений)

Было собрано 20 изображений с лошадьми для базы данных. Подбирались фотографии с разными ракурсами, позами, фоном, планами и другими характеристиками.

Original size 3500x3348

Генерируем описание к изображению

Original size 1123x602

Обучение (500 шагов, сохранение каждые 250 шагов)

Код и датасет

Файл с кодом: https://disk.yandex.ru/d/cbB3TUQYlCy8kw

Датасет с фотографиями: https://disk.yandex.ru/d/NBhcSbswuP1Nmg

Обучение генеративной нейросети под объект
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more