Original size 1140x1600

Улицы Токио глазами искусственного интеллекта

PROTECT STATUS: not protected

Идея проекта

В рамках данного проекта была поставлена задача обучить генеративную нейросеть создавать изображения в эстетике «Неонового Токио», сочетающей элементы урбанизма, киберпанка и современной цифровой культуры.

Основной целью исследования стало изучение того, насколько искусственный интеллект способен освоить визуальный язык и атмосферу мегаполиса будущего, где главную роль играют свет, отражения и цвет.

Исходные изображения

В качестве датасета было собрано 36 бесплатных фотографий улиц Токио с сайта Unsplash.

big
Original size 5262x3720

Фотограф — Jezael Melgoza

Главная цель эксперимента заключалась в том, чтобы обучить модель не просто воспроизводить визуальные элементы, а передавать целостное ощущение атмосферы — световой, эмоциональной и композиционной. В процессе обучения особое внимание уделялось следующим аспектам:

• формированию характерной неоновой цветовой палитры и реалистичных световых переходов; • корректной передаче глубины и перспективы городского пространства; • воспроизведению эмоционального настроения, объединяющего холод урбанистической среды и эстетическую выразительность света.

Original size 5262x3720

Фотограф — Ayumi Kubo

Процесс обучения

Первый этап обучения — импорт нужных библиотек и загрузка датасета.

Original size 1401x707
0

Следующим этапом было сгенерировать подписи к каждому изображению.

Original size 1549x581
0

Дальше — уже само обучение нейросети. Для качественного, но быстрого обучения были выбраны следующие параметры:

• resolution = 512 • train_batch_size = 2 • max_train_steps = 1000 • checkpointing_steps = 250

Время обучения составило 1 час 38 минут.

Original size 899x537

Готовый результат был загружен на Hugging Face. После этого начался процесс генерации серии изображений.

0
Original size 1721x655

Серия сгенерированных изображений

prompt: «photo collage in NEON TOKYO style, glass skyscrapers reflecting neon advertisements, modern japan, ultra-detailed»

В первом заходе нейросеть смогла сохранить общую идея неонового мегаполиса, однако стиль смещается в сторону футуризма и гиперреальности. Цветовая палитра ограничена в основном розово-фиолетовыми и пурпурными оттенками, что придаёт сцене ощущение сна или киберпанковской эстетики.

Исходное фото (фотограф — Erik Eastman) // Генерация нейросети

prompt: «photo collage in NEON TOKYO style, rainy night bus stop with glowing signs, reflections, lonely atmosphere»


prompt: «photo collage in NEON TOKYO style, rainy city street, reflections of red and purple neon, futuristic signage, moody lighting»

Генерации нейросети

prompt: «photo collage in NEON TOKYO style, crowded shinjuku crossing, vibrant lights, urban chaos, cinematic night photography»

Нейросеть искажает перспективу, а цвета создает кислотными. Люди превращены не просто в размытые силуэты, а в абстрактные потоки света и энергии, сливающиеся в единый пульсирующий организм. Здания теряют конкретику, вывески становятся символическими формами, а сам город ощущается не как физическое пространство, а как метафора цифрового будущего — переполненного, гипнотического, одновременно прекрасного и тревожного.

Исходное фото (фотограф — Denys Nevozhai) // Генерация нейросети

prompt: «photo collage in NEON TOKYO style, futuristic tokyo street blended with digital artifacts, glitch aesthetic»


prompt: «photo collage in NEON TOKYO style, monorail over futuristic city, glowing signs below, cyberpunk vibe»

Генерации нейросети

prompt: «photo collage in NEON TOKYO style, close-up of neon sign with japanese characters, glowing blue and magenta, shallow depth of field»


prompt: «photo collage in NEON TOKYO style, shop window glowing in the dark, pink and cyan tones, cinematic photography»

Преобладают розовые, малиновые и фуксии тона, с акцентами синего и фиолетового. Это не просто «розовый свет», а цветовая фильтрация всей реальности, как будто город окутан гигантским лазерным шоу.

Генерации нейросети

prompt: «photo collage in NEON TOKYO style, cyberpunk cityscape, electric blue and magenta lights, high-rise buildings, cinematic perspective»


prompt: «photo collage in NEON TOKYO style, ethereal city lights through fog, minimalist composition, neon hazec»

Здания и дороги упрощены до силуэтов, освещение — не источник света, а сама текстура пространства. Город выглядит как единый цифровой организм, где каждый пиксель светится. Цвета «затушеваны» легкой дымкой, что создаёт эффект расстояния и таинственности.

Генерации нейросети

prompt: «photo collage in NEON TOKYO style, futuristic alley in a japanese city, glowing signs, rainy atmosphere, puddles reflecting lights, cyberpunk style»


prompt: «photo collage in NEON TOKYO style, subway train arriving at neon-lit station, reflections on metal, cinematic lighting»

Генерации нейросети

prompt: «photo collage in NEON TOKYO style, reflections on puddle, blurred city lights, abstract composition»


prompt: «photo collage in NEON TOKYO style, wet glass surface with raindrops and colored reflections, bokeh background»

Генерации нейросети

Нейросеть справилась с задачей на высоком уровне, продемонстрировав впечатляющую способность к стилизации и атмосферному погружению. Она успешно передала ключевые элементы — неоновую эстетику, масштаб мегаполиса, узнаваемые символы (Токийская башня, перекрёстки), — но не как фотограф, а как художник-интерпретатор. Каждое изображение — это отдельная визуальная вселенная: от гипернеонового киберпанка до меланхоличной фиолетовой мечты. Нейросеть отлично работает с цветом, светом и композицией, создавая мощные эмоциональные эффекты.

Однако она теряет детализацию, читаемость текстов и анатомическую точность — что нормально для стилизованной генерации, но делает изображения непригодными для документальных или реалистичных задач. В целом, отличный инструмент для концептуального дизайна, арта, обложек и визуальных метафор, но не замена живому художнику. ИИ здесь — помощник, создающий вдохновляющие основы, которые требуют человеческой доработки для обретения глубины и смысла.

Описание применения генеративной модели

Stable Diffusion— обучение генеративной нейросети.

BLIP — генерация подписей к изображениям.

Hugging Face — генерация токена и загрузка модели на сайт.

Улицы Токио глазами искусственного интеллекта
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more