Original size 1006x1509

Скрытая питательность повседневных продуктов

PROTECT STATUS: not protected
The project is taking part in the competition

Сравнение калорийности, БЖУ, железа и витамина C в разных категориях еды

Какие данные были выбраны: Для финального проекта был выбран датасет с платформы Kaggle с названием — «Food Nutrition Dataset s», что дословно переводится как «Набор данных о питании». В нем содержится информация о 200 наиболее часто употребляемых повседневных продуктов питания с указанием, калорийности, содержания белков, жиров, углеводов, железа и витамина C.

Почему эти данные интересны? Тема питания широко распространена в наши дни, поскольку с каждым днем все больше людей начинает более грамотно простраивать свой рацион, следя за своим здоровьем. Данный датасет помогает понять насколько наши интуитивные представления о «полезных» и «вредных» продуктах совпадают с реальными цифрами.

Какие виды графиков и почему?

Для анализа были использованы несколько типов визуализаций: boxplot’ы для сравнения распределений калорий по категориям, горизонтальные столбчатые диаграммы для ранжирования продуктов, точечные диаграммы для анализа взаимосвязи калорий и углеводов, а также группированные столбчатые диаграммы для сравнения среднего содержания БЖУ в разных категориях

Сбор, обработка и доработка данных

Как уже говорилось ранее датасет был найден самостоятельно и загружен с сайта Kaggle. Далее датасет был загружен в Google Colab в котором проводилась вся работа. С помощью библиотеки Pandas для python были проверены размерность, типы столбцов, наличие пропусков, построена описательная статистика (минимум, максимум, среднее, медиана, квартили) и матрица корреляций для основных показателей. Далее были посчитаны дополнительные показатели эффективности продуктов: количество белка, жира и углеводов на 100 ккал, что позволило сравнивать продукты не только по абсолютному содержанию нутриентов, но и по тому, насколько «выгодны» они относительно своей калорийности.

big
Original size 2880x1289
  1. Первичный просмотр данных и наличие пропусков
  2. Минимальные, максимальные значения, среднее, медиана и квартили
Original size 2880x1190
  1. Добавление дополнительных столбцов для отображения ценности на каждые 100г продукта
  2. Анализируем связи между калориями, БЖУ, железом и витамином C
Original size 2880x1658

Распределение калорий по категориям

Данный график представляет собой boxplot, показывающий, как распределяется калорийность продуктов внутри восьми наиболее крупных категорий датасета.

На нем явно показано явно можно увидеть, что фрукты и фруктовые соки имеют наименьшую медианную калорийность среди всех продуктов, хоть и есть выбросы скорее всего указывающие на различные добавки в состав в виде например сиропа.

На последнем же месте — выпечка, самая калорийная категория. медиана превышает 1100 ккал, а верхние значения доходят до 1500 ккал.

Original size 2880x1658

Топ 15 продуктов по содержанию белка на 100 ккал

Данный график представляет собой горизонтальную столбчатую диаграмму, показывающую продукты, которые дают максимальное количество белка на каждые 100 ккал. Это позволяет оценивать «эффективность» продукта с точки зрения белковой ценности при минимальной калорийности. Явный лидер данного датасета по этому параметру — свинина с чили и томатами 12г белка на 100 ккал продукта.

Далее идут греческие йогурты CHOBANI с 8-9 г белка на 100 ккал. Затем высокобелковые овощи и растительные продукты, чеснок, зеленый лук, виноградные листья и т. д.

Original size 2880x1658

Калории против углеводов по категориям

Данный график показывает взаимосвязь между калорийностью продукта (ось X) и содержанием углеводов (ось Y) для пяти категорий: Фрукты и фруктовые соки, Овощи, Торты и пирожные, Картофельные чипсы, Различные сладости. Каждая точка — отдельный продукт, а цвет обозначает категорию.

Фрукты и фруктовые соки имеют много углеводов 12-15г, но при этом у них низкая или умеренная калорийность 50-100ккал. Тут же можно опять увидеть выброс который мы видели ранее 1300-1400ккал 75-80 углеводов, можно так же сделать вывод, что такие высокие показатели могут иметь различные сиропы на основе фруктов

Original size 2880x1658

Среднее содержание БЖУ по выбранным категориям

Данный график показывает средние значения белков, углеводов и жиров на 100 г для пяти выбранных категорий: Фрукты и фруктовые соки, Овощи, Торты и пирожные, Напитки. В фруктах и соках почти отсутствует белок, но есть углеводы.Овощи имеют достаточно высокое кол-во углеводов, что объясняется крахмалом в их составе. Выпечка так же как и соки почти не имеет белка, но при этом кол-ва углеводов сильно выше. Чипсы имеют огромное кол-во как жиров так и углеводов, что говорит о том, что это не самая правильная еда. Напитки имеют умеренное кол-во углеводов, но так же не являются источником белка.

Original size 2880x1658
Скрытая питательность повседневных продуктов
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more