
Вводная часть
На сайте Kaggle от пользователя Gati Ambaliya я нашла данные «Spotify dataset» по трекам из Spotify с наименованием автора, жанра, названия, id трека, альбома, популярность (по шкале от 0 до 100), продолжительности и содержит ли трек какой-либо нецензурный контент.
Датасет содержит 6187 треков, однако я сократила это число, выбрав жанры black-metal, death-metal, heavy-metal, metal и metalcore и в итоге число сократилось до 250. Не так много для этого направления музыки, что очень грустно.
Я выбрала эти жанры, потому что они наиболее мне интересны и привлекательны, как большому фанату метал музыки, так что я хочу рассмотреть, насколько данный жанр вообще популярен, продолжительность треков и, самое интересное, насколько много непристойного контента содержится в «музыке дьявола», то, как многие считают, чем этот жанр является.
Я выбрала следующие виды графиков: - столбчатая диаграмма «Популярность жанров»; - столбчатая диаграмма «Средняя продолжительность треков»; - круговая диаграмма «Соотношение нецензурного контента»; - корреляция heatmap «Соотношение содержания нецензурного контента с жанром».
Этапы работы

Описание датасета с kaggle авторства Gati Ambaliya

Код
Как я уже написала в вводной части, из всех данных я выбрала жанры тяжелой музыки и сделала из них отдельную таблицу под названием «allmetal» для дальнейшего удобства.
Цветовые палитры с сайта matplotlib
Для оформления я взяла красные агрессивные оттенки и черный, которые скорее всего ассоциируются с таким жанром. Также для этого я использовала цветовую палитру «hot» из библиотеки colormaps.
Итоговые графики
Первый график
Код для первого графика
Первый график популярности жанра. Он оценивается в столбце popularity по шкале от 0 до 100: чем выше, тем популярнее. Как мы можем увидеть, получилось больше половины, что вполне неплохо.
Для того, чтобы разобраться и правильно импортировать нужную мне цветовую палитру, я использовала Chat GPT, попросив его исправить изначально в моем коде ошибки и затем спросила код, как я могу регулировать цветами внутри палитры, менять цвета, как сделать цвет фона. В итоге получился код выше.
Второй график
Код для второго графика
Дальше мне было интересно посмотреть на среднюю продолжительность треков жанров. Особенно сейчас, в очень быстром мире, хронометраж песен стремительно сократился, нежели это было несколько десятилетий назад, когда рок-баллада, к примеру могла идти чуть ли не до 10 минут, когда как сейчас, это кажется невероятным временем для песни. Судя по всему, порогом вхождения в такую музыку может стать metalcore для современного слушателя.
Тут тоже не обошлось без проблем касательно цветов, поэтому я пошла исправлять ошибки в коде с помощью Chat GPT.
Третий график
Код для третьего графика
И самое интересное, что осталось, — нецензурный контент, который и вправду оказался в большинстве треков.
Четвертый график
Код для четвертого графика
В этом графике было интересно уточнить, какой или какие именно жанры больше всего содержат такого рода контент. И им оказался metal. Он пресекается со значением 'True' (что значит, что треки имеют нецензурный контент) больше всех и наоборот со значением 'False' (треки не имеют нецензурный контент) — меньше всего. В metalcore оказалось наименее нецензурного контента. Возможно, с него можно начать погружать свою бабушку в прекрасный мир метал музыки.
Вывод
Я была рада увидеть, что метал музыка хоть и не находится и наверху рейтингов, но и не на самом низу. Надеюсь, этот показатель будет только расти со временем.
Честно говоря, графиками с нецензурным контентом, хотелось показать, что это только на первый взгляд кажется, что метал музыка состоит из такого наполнения, но на деле оказалось чуть иначе. Но это все еще не показатель плохой «дьявольской» музыки!
Как итог, было интересно посмотреть на музыку с точки зрения сухой статистики и цифр и узнать что-то новое для себя в интересующей меня музыки.
Использованные ИИ: - Chat GPT: https://chatgpt.com/
Использованный датасет: - Spotify dataset: https://www.kaggle.com/datasets/ambaliyagati/spotify-dataset-for-playing-around-with-sql/data
Скриншот цветовых палитр с сайта matplotlib: - https://matplotlib.org/stable/users/explain/colors/colormaps.html
Ссылка на код и датасет: - https://drive.google.com/drive/folders/15qOpfOgJAqTQPPFgAuKqp6wK-qSly5cC?usp=sharing