Исходный размер 1140x1600

Pizza, per favore!

PROTECT STATUS: not protected

Заведём таймер ⏰

Мой проект посвящон пицце, потомучто пица вкусная (покрайней мере те что я пробовал)! Крометого выбраная тема открывает возможности для следования двух интересных вопросов: Как выглядит идеальная пица для обсолютно разных людей? И наколько вообще полезна такая пица для физического и финансового благополучая?

Чтобы найти ответы, я взял два набора данных, которые смотрят на пиццу с разных сторон.

Pizza Tastes.csv — данные о заказах из разных ресторанов. Содержит информацию о добавках (сыр, грибы, острота), размере в дюймах и цене. Это наш «финансовый» датасет.
Pizza Health.csv — лабораторные данные о химическом составе пицц. Содержит процентное содержание влаги, белка, жира, золы, натрия, углеводов и калорийность. Это наш «физический» датасет.

Подготовка 🎒

Прежде чем приступить к иследованию, данные нужно почистить и обогатить. Вот ключевые шаги:

0

Идеальная пица 🪄

B представленной табице Pizza Tastes (которую можно найти по ссылке ниже) представлены данные об начинках, размере и цены пиццы, визуализируем эти данные:

0

🪧 Большие пиццы (15 дюймов) часто имеют низкую цену за квадратный дюйм, то есть они выгоднее по площади. Маленькие пиццы (8-9 дюймов) — самые невыгодные с этой точки зрения.

0

🪧 Обсолютно естественно, что пицца «Всё вместе» — самая дорогая. «Только острота» добавляет мало к стоимости. «Сыр+Грибы» — популярная и дорогая комбинация.

Поллезная пица 🍃

Теперь расмотрим таблицу Pizza Health (которая тагже доступна по ссылке ниже). Вней расматриваеться пищевая ценность саммых разснообразных пицц. Визуализируем эту информацию.

0

🪧 Жир (fat) имеет самую сильную положительную корреляцию с калорийностью (cal). Хочеться мало калорийной пиццы — нужен вариант с пониженным содержанием жира (меньше сыра, колбасы).

0

🪧Большая часть образцов попадает в рекомендуемый диапазон 2-5%, но значительная доля (23.2%) превышает максимальную норму в 5%, что немного растраивает. Однако есть небольшая группа пицц с содержанием золы ниже 2%, что ободряет.

Время пришло 🏁

post

Чтож расмотрев ичерпывающие граффики можно сделать несколько смелых заявлений:

🌟 Популярная пицца: 12 дюймов, с сыром и грибами, без остроты. Это баланс размера, цены и умеренной калорийности. 🧾 Цена: Сильнее всего на нее влияет размер и комбинация добавок. Самая выгодная цена за площадь — у большой пиццы (15 дюймов) без добавок. 📊 Калорийность: Главный источник калорий — жир (сыр, колбаса). Острые добавки сами по себе мало влияют на калории. Такчто если вы хотите малоколариуную пицу придёться отказаться от двойного сыра и добавок в виде колбасы. 🤖 Наиболее привлекательное соотношение: Низкая стоимость и низкие калории — пицца без добавок или только с грибами. Если вкус важнее — комбинация сыра и грибов дает максимальный эффект.

Данные говорят, что существует идеальная пицца, и она размером 12 дюймов. Осталось лишь навестить ближайшую пиццерию и восторженно произнести: «Pizza, per favore!» 🍕

Приложения 📎

Датасеты, блокнот IPYNB: Ссылка на репозиторий.

Основные статистически методы: a. Описательная статистика — средние значения, мода, стандартное отклонение b. Корреляционный анализ — исследование взаимосвязей между переменными c. Группировка и агрегация — анализ данных по категориям (топпинги, размеры) d. Сравнение распределений — box plots, scatter plots для сравнения групп

Датасеты на Kaggle: Pizza Tastes, Pizza Health.

Pizza, per favore!
Проект создан 16.01.2026
Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную...
Показать больше