Original size 1240x1750

Визуализация HR-исследований

PROTECT STATUS: not protected

концепция

ПОИСК > При поиске материалов для визуализации данных с помощью возможностей языка программирования python я воспользовалась онлайн-платформой Kaggle.com, где есть специальный раздел с датасетами для визуализации.

ДАННЫЕ > Для создания проекта я выбрала данные о производительности и удовлетворенности сотрудников (ссылка на исходный датасет). Этот датасет содержал в себе много интересных данных о различных аспектах жизни офисных сотрудников: их возраст, зарплату, дату начала работы, продуктивность, удовлетворенность и фидбэк от других сотрудников.

ВИЗУАЛИЗАЦИЯ >

При анализе датасета у меня получилось 4 графика, в зависимости от видов используемых данных и способа их отношения: 1. Столбчатый 2. Линейный 3. Круговая диаграма 4. Матрица

Также для графиков был разработан единый стиль с помощью применения цветовой палитры, взятой из библиотеки MatPlotLib, а также с помощью редактирования стилей текста.

ИНСТРУМЕНТЫ > - Библиотеки NumPy, Pandas, Matplotlib - Chat GPT - Leonardo.Ai (для обложки)

предварительная обработка данных

big
Original size 2910x741

Прежде чем приступить к визуализации я привела данные стобца «Joining Date», записанные в формате MON-YY к полной записи года. Месяцы и прочие уточнения даты в моем случае было бы целесообразно убрать, так как в данных числился только январь.

[promt]: «how to apply type of data to all values in column»

big
Original size 2910x1052

Полученная запись дала возможность заодно рассчитать и добавить столбец о длительности работы в компании для каждого сотрудника.

Original size 2910x858

После проведенных вычислений я закрепила результат, приведя даты к временному значению для дальнейшего построения графиков

[promt]: «how convert integer which represents the year to the actual date, using python pandas»

Original size 2890x542

график#1

Original size 2418x1364
Original size 2884x1054
Original size 2908x577

[promt]: «from this data: newbies_df = df.groupby ('Joining Date').agg ({ 'Joining Date': 'count'}).rename (columns={ 'Joining Date': 'Count of newbies' }) create barplot»

график#2

Original size 2184x1303
Original size 2902x902
Original size 2912x1184

[promt]: «plot a pie chart based on this data: df.groupby ('Department').agg ({ 'Department': 'count'}).rename (columns={ 'Department': 'Count of employees' })», «How can I edit labels and add values for this chart?»

график#3

Original size 2410x1369
Original size 2906x1136
Original size 2912x624

[promt]: «make graphic based on this dataset: df.groupby ('Joining Date').agg ({ 'Joining Date': 'count'}).rename (columns={ 'Joining Date': 'Count of newbies' })», «make this graph more colorful and smooth», «create this diagram with this dataset: salary_by_projects = df.groupby ('Projects Completed')['Salary'].mean ().reset_index ()»

график#4

Original size 2333x1428
Original size 2912x980
Original size 2908x660

[promt]: «with matplotlib create matrices diagram where axis x = Position ('Analyst', 'Intern', 'Junior Developer', 'Manager', 'Senior Developer', 'Team Lead') and y = Gender ('Male', 'Female') It meant to count how much of each gender on every position»

Визуализация HR-исследований
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more