
Введение
Я выбрала делать анализ этой темы, потому что считаю, что это не только вопрос личного выбора, но и общественного здоровья, поскольку влияет на качество образования, безопасность и будущее молодежи.
ссылка на используемые данные https://www.kaggle.com/datasets/uciml/student-alcohol-consumption
вид графиков — столбчатые и 3d (многомерный)
В современном обществе среди молодежи распространено употребление алкоголя. Однако, насколько сильно это влияет на их учебу и социальную жизнь?
В этом исследовании будет выявлено, какие факторы связаны с употреблением алкоголя среди студентов и как это влияет на их успеваемость.
Основные вопросы исследования:
Как ежедневное и выходное употребление алкоголя связано с успеваемостью? Какие социальные и семейные факторы влияют на склонность к употреблению алкоголя? Как изменяются оценки в зависимости от учебного времени и пропусков занятий? Кто чаще употребляет алкоголь — студенты из маленьких или больших семей? Те, кто живёт в городе или деревне? Влияет ли свободное время и встречи с друзьями на уровень потребления алкоголя?
Методы анализа:
Корреляционный анализ — выявление зависимостей между переменными. Визуализация данных — для лучшего понимания связей. Группировка данных — анализ средних значений алкоголя и оценок среди разных категорий студентов. 3D-графики — исследование многомерных зависимостей.
Ожидаемые результаты:
Определить, как употребление алкоголя влияет на оценки. Выяснить, какие социальные группы больше склонны к употреблению алкоголя. Найти ключевые зависимости между учебными и социальными факторами.
(01) код
(02) код
Анализ блока «Влияние алкоголя на оценки»
В этом блоке представлены две диаграммы «boxplot», которые показывают, как ежедневное и выходное потребление алкоголя связано с итоговой оценкой.
Уровни Dalc: от 1 (очень низкое) до 5 (очень высокое). На оси Y — итоговая оценка (G3). Основные наблюдения: — Чем выше уровень Dalc, тем ниже медианная оценка G3. — Разброс оценок у тех, кто не пьет, значительно выше — среди них есть и высокие, и низкие оценки. — При Dalc = 4-5 (высокий уровень алкоголя) практически нет высоких оценок — большинство студентов имеют низкий G3 (<10).
Вывод:
Частое употребление алкоголя в будни снижает шансы на высокие оценки. Студенты, которые пьют много алкоголя ежедневно, реже получают оценки выше 10.
Уровни Walc: от 1 (очень низкое) до 5 (очень высокое). Ось Y — итоговая оценка (G3). Основные наблюдения: — В целом зависимость схожа с Dalc: учащиеся с высоким Walc имеют более низкие оценки. — Но эффект менее выражен, чем у Dalc — есть студенты, которые активно употребляют алкоголь по выходным, но все еще получают хорошие оценки. — При Walc = 4-5 средняя оценка ниже, но встречаются и исключения.
Вывод:
Алкоголь в выходные тоже негативно влияет на учебу, но не так критично, как ежедневное употребление. Студенты с высоким Walc в среднем учатся хуже, но среди них есть те, кто сохраняет высокий уровень G3.
Глобальные выводы по этому блоку
Итог: Студенты, которые пьют каждый день, чаще имеют плохие оценки. Студенты, которые пьют только в выходные, могут показывать разные результаты, но в среднем их успеваемость тоже ниже. Лучший вариант для хороших оценок — умеренное или полное отсутствие употребления алкоголя.
Корреляционная матрица
(03) код
1. Анализ зависимостей между оценками (G1, G2, G3)
Переменные Коэффициент корреляции G1 ↔ G2 ≈ 0.85 G2 ↔ G3 ≈ 0.90 G1 ↔ G3 ≈ 0.80
Разбор: Связь между G1, G2 и G3 очень сильная. Это логично: успешные студенты стабильно показывают хорошие результаты. Важно: однако коэффициент <1.0, что значит, что успех на начальных этапах не гарантирует финального результата. Возможны факторы, которые ухудшают или улучшают оценку к концу учебного года.
Вывод: Если у студента низкая G1, то с высокой вероятностью его итоговая G3 будет тоже низкой. Это значит, что раннее вмешательство (дополнительные занятия, помощь в учебе) может улучшить финальный результат.
2. Влияние времени на учебу (studytime) на успеваемость (G3)
Переменные Коэффициент корреляции Studytime ↔ G3 ≈ 0.24
Разбор: Учебное время положительно связано с итоговой оценкой, но корреляция слабая. Это говорит о том, что просто учиться больше — не гарантия высоких оценок. Важнее качество обучения.
Вывод: Хотя большее время на учебу скорее поможет, оно не заменяет других факторов, например, эффективности обучения, уровня мотивации и базовых знаний.
3. Влияние потребления алкоголя на оценки (Dalc, Walc vs G3)
Переменные Коэффициент корреляции Dalc ↔ G3 ≈ -0.18 Walc ↔ G3 ≈ -0.22
Разбор: Употребление алкоголя негативно влияет на оценки. Влияние выходного алкоголя (Walc) чуть сильнее, чем ежедневного (Dalc).
Вывод: — Чем выше употребление алкоголя, тем ниже оценки. — Особенно опасно частое употребление в выходные, так как это может мешать восстановлению перед учебной неделей.
4. Связь между уровнем образования родителей и успеваемостью (Medu, Fedu vs G3)
Переменные Коэффициент корреляции Medu ↔ G3 ≈ 0.22 Fedu ↔ G3 ≈ 0.18
Разбор: — Если у родителей высокий уровень образования, то у ребенка выше вероятность получить лучшие оценки.
— Образование матери (Medu) оказывает более сильное влияние, чем образование отца (Fedu).
— Они могут лучше помочь с учебой или мотивировать к учебе.
— Мать, как правило, больше вовлечена в воспитание, поэтому ее образование оказывает большее влияние.
Вывод: Дети образованных родителей в среднем учатся лучше. Но! Это не 100% зависимость — есть дети с низким уровнем родительского образования, но высокими оценками.
5. Социальные факторы и алкоголь (Goout, Freetime vs Walc, Dalc)
Переменные Коэффициент корреляции Goout ↔ Walc ≈ 0.35 Freetime ↔ Walc ≈ 0.18
Разбор: Частота выходов с друзьями сильно коррелирует с уровнем употребления алкоголя. Свободное время влияет слабее, но тоже играет роль.
Вывод: — Чем чаще ученик выходит гулять, тем больше он склонен употреблять алкоголь. — Социальная активность важна, но должна быть сбалансирована с учебой.
Глобальные выводы из корреляции
— Лучший предсказатель успеха — предыдущие оценки. — Учебное время влияет, но важно его качество, а не количество. — Алкоголь ухудшает оценки, особенно если употребляется в выходные. — Образование родителей связано с успехами детей, особенно образование матери. — Чем больше социализация, тем выше уровень алкоголя. — Пропуски занятий почти не влияют на оценки — возможно, студенты компенсируют их.
3D визуализация
Анализ 3D визуализации
fig_3d3 = px.scatter_3d (df, x='freetime', y='goout', z='Walc', color='sex', title="Связь между свободным временем, выходами и алкоголем») fig_3d3.show ()
На данном графике представлены три переменные:
Ось X (freetime) — свободное время после школы. Ось Y (goout) — частота выхода с друзьями. Ось Z (Walc) — уровень потребления алкоголя в выходные.
Выводы: Чем больше свободного времени и чаще выходы с друзьями, тем выше потребление алкоголя. Среди учащихся с минимальным свободным временем и редкими выходами уровень употребления алкоголя минимален. Гендерное различие также заметно: студенты одного пола (цвет точек) могут отличаться по уровню потребления. Это подтверждает гипотезу о том, что социальная активность связана с частотой употребления алкоголя.
Выводы:
Кто чаще пьет алкоголь? Городские студенты чаще употребляют алкоголь, чем деревенские. Студенты из маленьких семей (≤3 человека) пьют больше, чем из больших семей. Те, кто не живет с обоими родителями, чаще употребляют алкоголь. Свободное время само по себе не ведет к алкоголю, но способствует встречам с друзьями. Чем активнее социальная жизнь студента (goout), тем выше уровень алкоголя. Портрет студента, склонного к употреблению алкоголя: Живет в городе Из маленькой семьи (≤3 человека) Не живет с обоими родителями Проводит много времени с друзьями Часто выходит гулять
Вывод: — Алкоголь — это не просто личный выбор, а социальный фактор. — Самые подверженные студенты — социально активные подростки из городов, у которых меньше родительского контроля. — Ключевой фактор — частота встреч с друзьями.
Заключение и ключевые выводы
Основные результаты анализа В ходе исследования были выявлены ключевые зависимости между успеваемостью студентов, их социальной активностью и уровнем употребления алкоголя.
1. Влияние алкоголя на успеваемость (G3)
— Ежедневное употребление алкоголя (Dalc) оказывает отрицательное влияние на оценки. — Студенты, которые пьют алкоголь каждый день, в среднем имеют более низкие оценки (G3 < 10). — Выходное употребление алкоголя (Walc) также снижает оценки, но не так критично, как ежедневное. — Однако среди тех, кто пьёт только по выходным, встречаются студенты с хорошими оценками.
Вывод: — Чем чаще студент употребляет алкоголь, тем ниже его успеваемость. — Ежедневное употребление наиболее негативно сказывается на учебных результатах.
2. Корреляционные зависимости и анализ учебных факторов
— Лучший предсказатель итоговой оценки (G3) — это предыдущие оценки (G1, G2). — Время на учебу (studytime) положительно коррелирует с G3, но влияние слабое. — Количество пропусков занятий (absences) практически не влияет на оценки.
Вывод: — Успеваемость зависит от накопленных знаний и учебных привычек, а не только от количества времени на учебу. — Пропуски не всегда ухудшают оценки, если студент самостоятельно восполняет пробелы.
3. Итоговый портрет студента, склонного к употреблению алкоголя
— Живёт в городе — Из маленькой семьи (≤3 человека) — Не живёт с обоими родителями — Проводит много времени с друзьями — Часто выходит гулять (goout = 5) — Тратит меньше времени на учебу и имеет сниженные оценки
Глобальные выводы
— Алкоголь негативно влияет на оценки, особенно при ежедневном употреблении. — Учебное время важно, но не является главным фактором успеха — качество знаний играет большую роль. — Социальные факторы — ключевые предикторы употребления алкоголя. — Частота встреч с друзьями — самый сильный показатель склонности к алкоголю. — Студенты, живущие в городах и маленьких семьях, без обоих родителей, пьют чаще.
Вывод: Чтобы повысить успеваемость и снизить уровень употребления алкоголя среди студентов, необходимо учитывать не только учебные, но и социальные факторы. Родительский контроль, осведомленность о последствиях и баланс между социальной жизнью и учебой — ключевые аспекты профилактики.