Original size 2480x3508

Анализ уличной еды

PROTECT STATUS: not protected

Описание

Уличная еда — настоящая культурная особенность каждого региона. Она популярна благодаря доступности, разнообразию и уникальному сочетанию вкусов. В последние годы уличная еда становится трендом даже в гастрономии, выходя за рамки обычных закусок и превращаясь в объект кулинарных экспериментов.

Для анализа я выбрал данные (Fully Cleaned Street Food Dataset) о популярных блюдах из разных стран мира с сайта Kaggle. Данные содержат информацию о названии блюда, стране происхождения, его описании, калорийности, типе подачи (горячее или холодное), основных ингредиентах, категории (десерт, закуска и т. д.), времени приготовления и популярности.

Датасет отражает гастрономическое разнообразие мира. Исследование поможет выявить какие страны предлагают самые калорийные блюда, какие категории блюд (например, закуски или десерты) — наиболее популярны, какие ингредиенты чаще всего используются в кулинарии, как время приготовления соотносится с популярностью — блюда. А также названия самых популярных блюд серди уличной кухни.

Для визуализации данных мной были выбраны — облако слов, круговая диаграмма, точечная диаграмма, гистограмма, донат-диаграмма.

post

Для определения цветовой палитры я опиралась на одни из самых распространенных ингредиентов блюд — мясо и рис. А также на эмоциональное восприятие палитры — теплую, насыщенную, энергичную и аутентичную атмосферу.

Обработка данных

Сначала я импортировала все необходимые библиотеки. После этого я настраиваю шрифт для визуализаций с помощью FontProperties, загружаю файл с данными из CSV с помощью pd.read_csv () и выводим информацию о структуре данных с помощью метода df.info (), чтобы понять, с какими столбцами и типами данных я работаю. Это помогает сразу оценить, насколько хорошо подготовлены данные для дальнейшей обработки и визуализации.

0

Самые популярные ингредиенты street food

Первым шагом я решил посмотреть, какие ингредиенты наиболее часто встречаются в уличной еде разных стран.

Для этого я собрала данные из столбца «Main Ingredients», объединила их в одну строку и создала облако слов с помощью WordCloud. Готовое изображение вывела с помощью plt.imshow () и убрала оси для чистоты визуализации.

Original size 4080x2079
Original size 1294x1056

Категории блюд

Далее я решил выяснить, какие категории блюд встречаются чаще всего.

Здесь строится круговая диаграмма для топ-3 категорий из столбца Category. Сначала с помощью value_counts () подсчитываются уникальные значения категорий, а затем извлекаются топ-3. Потом создается круговая диаграмма с параметрами: настройка цветов, аннотации для процентов, взрыв сегментов и шрифт. Используется plt.pie () для отображения диаграммы, после чего оси отключаются, чтобы оставить только саму диаграмму.

Original size 1699x1206
Original size 1734x1092

Калории и Время Приготовления: зависимость в популярности блюд

Я использую метод twinx (), чтобы создать две оси Y на одном графике. Одна ось будет показывать количество калорий (с использованием левой оси), а другая — время приготовления (с использованием правой оси). Это позволяет сравнивать данные, которые имеют разные единицы измерения.

Для каждого из показателей (калории и время приготовления) я строю точечный график (scatter plot). Точки для калорий отображаются с использованием одного цвета (основной цвет #5d1514), а точки для времени приготовления — с другим цветом (#ac7c6a).

Далее я добавляю подписи к осям, чтобы было понятно, что каждая ось представляет. Левые оси отображают количество калорий, а правые — время приготовления.

Original size 4079x1978
Original size 2048x1128

Средняя калорийность блюд по странам

Здесь я строю гистограмму для отображения средней калорийности блюд по странам/регионам. Для этого я использую метод groupby (), чтобы сгруппировать данные по столбцу Country/Region, и затем вычисляю среднее значение калорий с помощью mean (). Гистограмма отображает страны на оси X и средние калории на оси Y. Далее настраиваю цвета, шрифт и метки, чтобы сделать визуализацию более понятной.

Original size 4546x2146
Original size 1970x1092

Соотношение горячих и холодных блюд

Далее я решила узнать, какие блюда чаще подают — горячие или холодные.

Подсчитала количество блюд каждого типа («Serving Type») и построила пироговую диаграмму с отверстием в центре (donut chart).

Original size 1642x1607
Original size 1734x1236

Названия самых популярных блюд

Последним шагом я решила узнать названия наиболее популярных блюд.

Здесь я создаю облако слов для отображения названий блюд, используя столбец Food Name. Процесс аналогичен первому облаку слов, но теперь отображаются именно названия блюд, а не ингредиенты.

0

Заключение

Из этого анализа я сделал несколько интересных выводов, которые помогают лучше понять, что происходит в мире уличной еды и какие факторы влияют на популярность различных блюд.

Во-первых, ингредиенты, такие как мясо, рис, специи и овощи, часто встречаются в уличной еде. Это говорит о том, что традиционные продукты, которые используют в разных кухнях мира, играют важную роль в составлении рецептов. Во-вторых, категория блюд. Когда я анализировала данные, оказалось, что среди уличной еды наибольшее распространение имеют закуски, основные блюда и десерты. Это не удивительно, ведь такие блюда легко есть на ходу. И, что интересно, десерты занимают гораздо больше места, чем я ожидала. Также было интересно узнать в каких странах предпочитают наиболее колоритную еду. Еще один момент, который мне стал очевиден, — это то, что калории не всегда связаны с популярностью блюд. Высокая калорийность не всегда гарантирует большую популярность уличных блюд, а время приготовления не всегда связано с калорийностью — некоторые калорийные блюда готовятся быстро. Наконец, я обратил внимание на то, что большинство уличных блюд подаются горячими.

Все эти выводы дают лучшее понимание того, как устроена уличная еда в разных странах и на чем строятся предпочтения людей. Эти данные помогают выявить гастрономические тенденции по регионам и понять, какие особенности уличной пищи являются наиболее важными для потребителей. Такой анализ может быть полезен для рестораторов, предпринимателей в сфере уличной еды, а также для туристов, которые интересуются гастрономией разных стран.

Описание применения генеративной модели

Проект был создан с помощью ChatGPT 4.0, к которому я обращалась при написании кода с целью оптимизации, а также с помощью Recraft AI при создании обложки.

Анализ уличной еды
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more