Original size 2280x3200

Social Media vs Productivity

PROTECT STATUS: not protected

Концепция исследование

Многие считают, что чрезмерное использование социальных сетей может негативно влиять на продуктивность и работоспособность. Но помимо развлечений, социальные сети могут служить источником информации и общения, что способствует улучшению продуктивности. Данное исследование направлено на то, чтобы понять, как различные аспекты использования социальных сетей (время, количество уведомлений, предпочтительные платформы) коррелируют с продуктивностью и уровнем стресса.

Для анализа я выбрала датасет «Social Media Usage vs Productivity», который содержит данные о времени, проведённом в социальных сетях, а также о различных факторах, которые могут влиять на продуктивность, таких как уровень стресса, удовлетворенность работой, количество перерывов и другие параметры.

Цель исследования: Оценить, как использование социальных сетей влияет на продуктивность и стрессы, а также выявить ключевые факторы, влияющие на эту зависимость.

big
Original size 3840x2160

Предварительные действия

#импортирую библиотеку

import seaborn as sns import matplotlib.pyplot as plt import pandas as pd import numpy as np

#вывожу первые 5 строк

df = pd.read_csv ('C:/Users/Dinozavr/Downloads social_media_vs_productivity.csv' df.head ()

#информация о датасете, смотрю есть ли пропущенные данные

df.info ()

#убираю пропущенные

df = df[df['daily_social_media_time'].isna ()== False]

График № 1: Распределение времени в соцсетях

График представляет собой гистограмму, отображающую распределение времени, которое люди проводят в социальных сетях ежедневно, измеренное в часах. На оси X указано количество часов, проведенных в соцсетях, а на оси Y — количество людей, проводящих это время.

По графику видно, что большинство людей проводят в социальных сетях от 0 до 5 часов в день, при этом пик приходится на диапазон от 2 до 3 часов. Время, превышающее 10 часов в день, встречается крайне редко.

sns.set_style («whitegrid») # сетка на фоне plt.figure (figsize=(12, 6)) # размер графика

Создание гистограммы с фиолетовыми оттенками

ax = sns.histplot ( data=df, x="daily_social_media_time», bins=15, # количество столбцов color="

8A2BE2»,

фиолетовый alpha=0.7, # прозрачность edgecolor="black», # чёрные границы столбцов linewidth=0.7 # толщина границ

Добавление заголовка и подписей

plt.title ( «Распределение времени в соцсетях (часов/день)», fontsize=16, pad=20 # отступ заголовка

plt.xlabel («Часы в соцсетях», fontsize=12) plt.ylabel («Количество людей», fontsize=12)

Настройка сетки и оформления

sns.despine (left=True) # убираем левую границу plt.grid (axis="y», linestyle="--» , alpha=0.4) # горизонтальная сетка plt.show ()

Original size 3840x2160

Вывод: Основная масса людей тратит умеренное количество времени в социальных сетях (менее 5 часов в день), что может указывать на то, что большинство пользователей пытаются сбалансировать время между личной и рабочей активностью.

График № 2: Распределение предпочтений соцсетей

Следующий график к которому я обращаюсь в своем исследование, это круговая диаграмма. На графике изображено распределение предпочтений пользователей социальных сетей.

Согласно диаграмме, все выбранные платформы — TikTok, Facebook, Instagram, Telegram и Twitter — имеют примерно равные доли среди пользователей, с небольшим перевесом у TikTok (20.3%), и чуть меньшими показателями для остальных платформ (около 19,8% — 20,0%).

platform_counts= df['social_platform_preference'].value_counts ()

Фиолетовая палитра (от светлых к тёмным оттенкам)

purple_palette= [ '

DDA0DD',

Сливовый светлый '

BA55D3',

Средний орхидей '

9932CC',

Тёмный орхидей '

9400D3',

Тёмный фиолетовый '

800080'

Фиолетовый ]

Создание круговой диаграммы

plt.figure (figsize=(10, 8)) wedges, texts, autotexts = plt.pie ( platform_counts, labels=platform_counts.index, autopct='%1.1f%%' , startangle=90, colors=purple_palette[: len (platform_counts)], wedgeprops={'edgecolor': 'black', 'linewidth': 0.5}, textprops={'fontsize': 12} )

Улучшаем подписи

plt.setp (autotexts, color='white', weight='bold') # Белые цифры с % plt.title ('Распределение предпочтений соцсетей', pad=20, fontsize=16) plt.tight_layout () plt.show ()

Original size 3840x2160

Вывод: Все платформы имеют примерно одинаковую популярность, что может указывать на разнообразие предпочтений среди пользователей. Это может свидетельствовать о равномерном распределении интересов в разных социальных сетях, что важно для маркетинговых стратегий, направленных на разные аудитории.

График № 3: Среднее время по возрастным группам

Далее, я решила проанализировать среднее время проведенное в соцсетях. График представляет собой столбчатую диаграмму, показывающую среднее время, которое люди проводят в социальных сетях в зависимости от возрастной группы. Мы анализируем, как возраст влияет на количество времени, проводимого в соцсетях.

bins = [0, 25, 35, 45, 100] # Границы групп labels = ['<25 лет', '25-34 года', '35-44 года', '45+ лет'] # Названия групп df['age_group']= pd.cut (df['age'], bins=bins, labels=labels, right=False)

Группируем данные по возрастным группам

age_media_time= df.groupby ('age_group')['daily_social_media_time'].mean ().reset_index

Настраиваем стиль

plt.figure (figsize=(10, 6)) purple_palette= sns.color_palette («Purples», n_colors=4) # 4 фиолетовых оттенка

Строим барчарт

ax = sns.barplot ( data=age_media_time, x='age_group', y='daily_social_media_time', palette=purple_palette, # подгружаем ранее созданные цвета edgecolor='black', #рамки linewidth=1, saturation=0.8 )

Добавляем аннотации и оформление

plt.title ('Среднее время в соцсетях по возрастным группам', pad=20, fontsize=16 plt.xlabel ('Возрастная группа', fontsize=12) plt.ylabel ('Часов в день', fontsize=12) plt.tight_layout () plt.show ()

Original size 3840x2160

Выводы: Люди младше 25 лет и в возрастной группе 25-34 года проводят в социальных сетях около 2.5-3 часов в день. Возрастные группы 35-44 года и 45+ лет проводят чуть меньше времени — около 2.0-2.5 часов в день.

Это может свидетельствовать о том, что молодежь и люди среднего возраста более активны в социальных сетях, в то время как более старшая группа проводит меньше времени на этих платформах.

График № 4: Факторы влияющие на продуктивность

Мы анализируем взаимосвязь между уровнем удовлетворенности работой (job_satisfaction_score), количеством чашек кофе в день (coffee_consumption_per_day), фактическим уровнем продуктивности (actual_productivity_score), временем, проведенным в социальных сетях (daily_social_media_time), и уровнем стресса (stress_level).

Выбираем нужные колонки

cols = ['job_satisfaction_score', 'coffee_consumption_per_day', 'actual_productivity_score', 'daily_social_media_time', 'stress_level'] df_selected= df[cols]

Считаем корреляцию Спирмена (подходит для нелинейных зависимостей)

corr = df_selected.corr (method='spearman')

Маска для верхнего треугольника (чтобы не дублировать)

mask = np.triu (np.ones_like (corr, dtype=bool))

Создаем фиолетовую палитру

purple_palette= sns.light_palette (»#8A2BE2», as_cmap=True, reverse=False)

Настраиваем размер

plt.figure (figsize=(10, 8))

Строим heatmap

sns.heatmap (corr, mask=mask, annot=True, fmt=».2f», cmap=purple_palette, vmin=-1, vmax=1, center=0, square=True, linewidths=.5, cbar_kws={"shrink»: .8})

Настраиваем внешний вид

plt.title («Корреляция Спирмена (фиолетовая палитра)\n» plt.xticks (rotation=45, ha='right') plt.tight_layout () plt.show ()

Original size 3840x2160

Выводы: Наибольшая положительная корреляция наблюдается между уровнем удовлетворенности работой и фактическим уровнем продуктивности (0.89). Это может свидетельствовать о том, что высокая удовлетворенность работой способствует повышению продуктивности. Низкая корреляция между временем, проведенным в социальных сетях, и другими переменными, такими как продуктивность или стресс, что указывает на то, что время, потраченное в соцсетях, не оказывает значительного воздействия на эти факторы. Отсутствие корреляции между количеством чашек кофе в день и другими переменными может означать, что потребление кофе не связано напрямую с продуктивностью, стрессом или удовлетворенностью работой.

График № 5: Общая тенденция

Через график scatter plot (диаграмма рассеяния), который показывает зависимость между временем, проведённым в социальных сетях (по оси X), и фактической продуктивностью (по оси Y), также добавлена линия тренда (регрессионная линия), чтобы наглядно показать общую тенденцию.

plt.figure (figsize=(10, 6)) sns.set_style («white»)

Простой scatter plot

plt.scatter ( x=df[«daily_social_media_time»], y=df[«actual_productivity_score»], color="

8A2BE2»,

Фиолетовый цвет s=30 # Размер точек )

Добавляем линию тренда

sns.regplot ( x=df[«daily_social_media_time»], y=df[«actual_productivity_score»], scatter=False, line_kws={"color»: «

4B0082», «linewidth»: 2}

Темно-фиолетовый )

Оформление

plt.title («Продуктивность vs Время в соцсетях», fontsize=16, pad=15) plt.xlabel («Часы в соцсетях в день», fontsize=12) plt.ylabel («Фактическая продуктивность», fontsize=12) plt.grid (axis='both', alpha=0.2, linestyle='--')

Фиолетовая рамка

for spine in plt.gca ().spines.values (): spine.set_edgecolor ('#9370DB') spine.set_linewidth (1.5) plt.tight_layout () plt.show ()

Original size 3840x2160

Выводы: Видна отсутствие явной зависимости между временем, проведённым в социальных сетях, и фактической продуктивностью. Точки рассеяны по графику без выраженной закономерности. Линия тренда практически горизонтальна, что подтверждает вывод о незначительном влиянии времени в соцсетях на продуктивность.

Таким образом, можно сделать вывод, что время, проведённое в социальных сетях, не имеет существенного воздействия на фактическую продуктивность пользователей.

Заключение

Несмотря на большое количество времени, которое многие пользователи проводят в социальных сетях, исследование показало, что это время не оказывает прямого воздействия на их продуктивность. Основными факторами, влияющими на продуктивность, являются внутреннее удовлетворение работой и другие личные характеристики, а не время, проведённое в социальных сетях.

Ссылки

Social Media vs Productivity
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more