Вводная часть
Для этого проекта я выбрал датасет «Mental Health in Tech Survey» с платформы Kaggle. Этот набор данных представляет собой результаты опроса, проведенного в 2014 году среди работников технологической индустрии, и включает информацию о демографии, условиях работы и психическом здоровье
Почему я выбрал эти данные?
Тема психического здоровья в технологической сфере глубоко меня заинтересовала, так как она затрагивает философские и психологические аспекты современной жизни. Технологическая индустрия известна своими высокими требованиями и стрессовыми условиями, что делает этот датасет уникальным для исследования влияния работы на человеческую психику. Это не просто набор цифр — это возможность заглянуть в эмоциональную и ментальную реальность людей, работающих в одной из самых динамичных отраслей мира. Проект обещает быть глубоким, оригинальным и полезным, так как он раскрывает неочевидные взаимосвязи между работой и благополучием.
Какие графики я выбрал и почему?
Я решил использовать следующие типы визуализаций:
Столбчатые диаграммы — для отображения категориальных данных, таких как доля людей, обращавшихся за лечением. Гистограммы — для анализа распределения возраста и его связи с психическим здоровьем. Сложенные столбчатые диаграммы — для исследования влияния факторов, таких как удаленная работа или размер компании, на психическое здоровье. Эти типы графиков позволяют наглядно представить как общие тенденции, так и детали, что соответствует заданию создать содержательную и стилизованную инфографику.
Анализ данных
Я сосредоточился на следующих вопросах:
Какова доля работников, обращавшихся за лечением психических расстройств? Как возраст и пол связаны с психическим здоровьем? Влияют ли условия работы (удаленка, размер компании) на ментальное состояние?
Стилизация графиков
Для создания оригинального стиля я:
Использовал палитру viridis, которая сочетает спокойные и технологичные оттенки. Сделал графики минималистичными, но информативными
Основная часть проекта
График показывает, что в технологической индустрии (согласно данным опроса 2014 года) примерно половина работников обращалась за лечением психических расстройств (622 из 1259, или около 49,4%), а другая половина — нет (637 из 1259, или около 50,6%). Это подчеркивает масштаб проблемы психического здоровья в отрасли: почти половина опрошенных сталкивалась с необходимостью лечения, что является значительным показателем.
Интерпретация графика
Распределение возраста:
График показывает, что большинство опрошенных находятся в возрастном диапазоне 20-40 лет, с пиком около 25-35 лет. Это ожидаемо для технологической индустрии, где много молодых специалистов. После 40 лет количество людей резко уменьшается, а после 60 лет — практически отсутствует, что также соответствует данным (в датасете мало людей старше 60).
Обращение за лечением:
В возрастной группе 20-40 лет (где больше всего людей) примерно половина обращалась за лечением, что согласуется с общим распределением (49,4% «Yes»). В более старших возрастных группах (40+ лет) доля тех, кто обращался за лечением, кажется чуть ниже, но выборка в этих группах меньше, поэтому выводы менее надежны.
Вывод: График подчеркивает, что проблемы с психическим здоровьем распространены среди молодых специалистов (20-40 лет), что может быть связано с высоким уровнем стресса на ранних этапах карьеры в технологической индустрии и нежеланием обращаться за помощью более пожилых людей
График подчеркивает, что проблемы с психическим здоровьем затрагивают значительную часть работников в технологической индустрии, особенно мужчин, которые составляют большинство выборки.
Мужчины чаще обращаются за лечением, чем женщины и люди из категории «Other». Это может быть связано с большей открытостью, большим уровнем стресса или просто с тем, что выборка мужчин больше.
Низкий процент обращений среди женщин и «Other» может указывать на социальные барьеры, такие как стигматизация или недостаточная поддержка для этих групп в индустрии.
Сравнение
Разница в доле обращавшихся за лечением между группами небольшая: 50,3% (офис) против 47,3% (удаленно). Это говорит о том, что удаленная работа в данном случае не оказывает значительного влияния на вероятность обращения за лечением. Однако можно заметить, что среди тех, кто работает удаленно, чуть больше людей не обращались за лечением (52.7% против 49,7% в офисе). Это может указывать на то, что удаленная работа в некоторых случаях снижает стресс или потребность в лечении, либо на то, что удаленно работающие реже обращаются за помощью из-за изоляции.
Общий контекст
В целом, 622 человека (49.4%) из всей выборки обращались за лечением, а 637 (50.6%) — нет. График показывает, что удаленная работа не создает значительных различий в этом распределении. Удаленная работа в 2014 году могла ассоциироваться как с плюсами (меньше стресса от поездок, больше гибкости), так и с минусами (изоляция, отсутствие социального взаимодействия), что и отражается в близких значениях.
График показывает связь между размером компании (по количеству сотрудников) и обращением за лечением психических расстройств. Данные разделены на шесть категорий размера компании: «1-5», «6-25», «26-100», «100-500», «500-1000», «>1000». Для каждой категории указано, сколько человек обращались («Да») и не обращались («Нет») за лечением, а также процентное соотношение.
Сравнение
Наибольшая доля обращавшихся за лечением наблюдается в маленьких компаниях (6-25 сотрудников, 55,9%) и крупных компаниях (500-1000 сотрудников, 55,0%). Это может быть связано с разными факторами: В маленьких компаниях (6-25) может быть больше стресса из-за нехватки ресурсов, высокой нагрузки на сотрудников и отсутствия программ поддержки. В крупных компаниях (500-1000) стресс может быть связан с бюрократией, высокой конкуренцией или давлением. Наименьшая доля обращавшихся за лечением — в очень маленьких компаниях (1-5 сотрудников, 43,8%). Возможно, в таких компаниях меньше стресса, больше гибкости и личного взаимодействия, что снижает потребность в лечении. В средних и очень крупных компаниях (26-100, 100-500, >1000) доля обращавшихся за лечением близка к средней по выборке (48.1%, 46,0%, 48,2%), что может указывать на более сбалансированные условия.
ссылка на код и датасет https://disk.yandex.ru/d/gGeNdhMO8LYBCw



