Original size 1750x2480

Адские графики

PROTECT STATUS: not protected

Вводная часть

На сайте Kaggle от пользователя Gati Ambaliya я нашла данные «Spotify dataset» по трекам из Spotify с наименованием автора, жанра, названия, id трека, альбома, популярность (по шкале от 0 до 100), продолжительности и содержит ли трек какой-либо нецензурный контент.

Датасет содержит 6187 треков, однако я сократила это число, выбрав жанры black-metal, death-metal, heavy-metal, metal и metalcore и в итоге число сократилось до 250. Не так много для этого направления музыки, что очень грустно.

Я выбрала эти жанры, потому что они наиболее мне интересны и привлекательны, как большому фанату метал музыки, так что я хочу рассмотреть, насколько данный жанр вообще популярен, продолжительность треков и, самое интересное, насколько много непристойного контента содержится в «музыке дьявола», то, как многие считают, чем этот жанр является.

Я выбрала следующие виды графиков: - столбчатая диаграмма «Популярность жанров»; - столбчатая диаграмма «Средняя продолжительность треков»; - круговая диаграмма «Соотношение нецензурного контента»; - корреляция heatmap «Соотношение содержания нецензурного контента с жанром».

Этапы работы

big
Original size 976x369

Описание датасета с kaggle авторства Gati Ambaliya

big
Original size 2480x1750

Код

Как я уже написала в вводной части, из всех данных я выбрала жанры тяжелой музыки и сделала из них отдельную таблицу под названием «allmetal» для дальнейшего удобства.

Original size 653x405

Цветовые палитры с сайта matplotlib

Для оформления я взяла красные агрессивные оттенки и черный, которые скорее всего ассоциируются с таким жанром. Также для этого я использовала цветовую палитру «hot» из библиотеки colormaps.

Итоговые графики

Original size 889x677

Первый график

Original size 1749x542

Код для первого графика

Первый график популярности жанра. Он оценивается в столбце popularity по шкале от 0 до 100: чем выше, тем популярнее. Как мы можем увидеть, получилось больше половины, что вполне неплохо.

Для того, чтобы разобраться и правильно импортировать нужную мне цветовую палитру, я использовала Chat GPT, попросив его исправить изначально в моем коде ошибки и затем спросила код, как я могу регулировать цветами внутри палитры, менять цвета, как сделать цвет фона. В итоге получился код выше.

Original size 939x670

Второй график

Original size 1752x595

Код для второго графика

Дальше мне было интересно посмотреть на среднюю продолжительность треков жанров. Особенно сейчас, в очень быстром мире, хронометраж песен стремительно сократился, нежели это было несколько десятилетий назад, когда рок-баллада, к примеру могла идти чуть ли не до 10 минут, когда как сейчас, это кажется невероятным временем для песни. Судя по всему, порогом вхождения в такую музыку может стать metalcore для современного слушателя.

Тут тоже не обошлось без проблем касательно цветов, поэтому я пошла исправлять ошибки в коде с помощью Chat GPT.

Original size 806x597

Третий график

Original size 1559x248

Код для третьего графика

И самое интересное, что осталось, — нецензурный контент, который и вправду оказался в большинстве треков.

Original size 761x795

Четвертый график

Original size 1754x366

Код для четвертого графика

В этом графике было интересно уточнить, какой или какие именно жанры больше всего содержат такого рода контент. И им оказался metal. Он пресекается со значением 'True' (что значит, что треки имеют нецензурный контент) больше всех и наоборот со значением 'False' (треки не имеют нецензурный контент) — меньше всего. В metalcore оказалось наименее нецензурного контента. Возможно, с него можно начать погружать свою бабушку в прекрасный мир метал музыки.

Вывод

Я была рада увидеть, что метал музыка хоть и не находится и наверху рейтингов, но и не на самом низу. Надеюсь, этот показатель будет только расти со временем.

Честно говоря, графиками с нецензурным контентом, хотелось показать, что это только на первый взгляд кажется, что метал музыка состоит из такого наполнения, но на деле оказалось чуть иначе. Но это все еще не показатель плохой «дьявольской» музыки!

Как итог, было интересно посмотреть на музыку с точки зрения сухой статистики и цифр и узнать что-то новое для себя в интересующей меня музыки.

Использованные ИИ: - Chat GPT: https://chatgpt.com/

Использованный датасет: - Spotify dataset: https://www.kaggle.com/datasets/ambaliyagati/spotify-dataset-for-playing-around-with-sql/data

Скриншот цветовых палитр с сайта matplotlib: - https://matplotlib.org/stable/users/explain/colors/colormaps.html

Ссылка на код и датасет: - https://drive.google.com/drive/folders/15qOpfOgJAqTQPPFgAuKqp6wK-qSly5cC?usp=sharing

Адские графики
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more