Original size 2480x3500

Анализ данных про видеоигры

PROTECT STATUS: not protected

Описание проекта

Тему для данного проекта я выбирала по своим собственным предпочтениям, остановившись на основном хобби — видеоиграх. В данном проекте я проанализирую различные данные видеоигр, например их жанры и годы выпуска, издателей и регионы продаж, что поможет иметь лучшее понимание про рынок видеоигр. Также, я визуализирую эти данные в графиках и диаграммах.

Для выбора базы данных я использовала сайт kaggle.com, на котором нашла нужный мне датасет.

big
Original size 1220x179

Выбранный датасет на kaggle.com

Этапы работы

Сначала, перед построением графиков, я импортировала все необходимые для дальнейшей работы библиотеки. После этого, я импортировала датасет, с данными которого буду составлять графики и диаграммы.

Я планировала использовать 4 вида диаграмм: - круговую - столбчатую - линейную - областную

big
Original size 790x111

Импорт библиотек

big
Original size 1581x253

Импорт базы данных

Затем, я определила типы данных, предоставленные в датасете. Я заметила, что тип данных для User_Score являлся object, а не float64, что могло помешать при дальнейшей работе.

big
Original size 606x337

Определение типов данных

Original size 981x233

Причина определения User_Score как object, а не float64

Определив, что это произошло из-за наличия ’tbd’ в данных, изменила их на nan и успешно преобразовала User_Score во float64.

Original size 1108x663

Процесс изменения User_Score с object на float64

Далее, я решила перевести названия всех столбцов с английского на русский, чтобы составить понятные диаграммы и графики в дальнейшем. Также, я добавила палитру цветов, которая использовалась при построении диаграмм.

Original size 1549x312

Процесс перевода названий столбцов, добавление палитры

Круговая диаграмма, показывающая использованные в играх жанры

Original size 1000x412

Круговая диаграмма

Данная диаграмма наглядно показывает самые популярные жанры, использованные в выпущенных видеоиграх. Самыми популярными оказались экшн (20.2%), спортивные (14%), ролевые (9%), приключенческие (7.8%) и прочие (10.5%).

Original size 971x253

Код для данной диаграммы

Столбчатая диаграмма, показывающая топ-10 издателей по продажам

Original size 863x666

Столбчатая диаграмма

Мы можем наблюдать, что самым популярным издателем по количеству продаж является Nintendo, причем с большим отрывом от других издательств. Между Electronic Arts и Activision тоже довольно-таки большая разница, а вот начиная с 4 места разница в продажах уходит на спад.

Original size 1329x317

Код для данной диаграммы

Линейная диаграмма, показывающая количество выпущенных игр за каждый год

Original size 863x552

Линейная диаграмма

На диаграмме видно, что самым плодородным в индустрии видеоигр был период с 2008 по 2009 год. Начиная с 1995 года наблюдались небольшие скачки, а из-за недостатка информации в датасете количество игр после 2015 года ушло на резкий спад.

Original size 556x227

Код для данной диаграммы

Столбчатая диаграмма, показывающая различия средних оценок критиков и пользователей по жанрам

Original size 781x496

Столбчатая диаграмма

Довольно-таки интересная диаграмма о средних оценках по жанру показывает, что в большинстве своем критики оценивают игры ниже, чем пользователи, за исключением одного случая — спортивных видеоигр. Также, мы можем наблюдать что средние оценки между всеми жанрами и у критиков, и у пользователей не находятся ниже 6 и не превышают 8.

При построении данной диаграммы обнаружилось, что системы оценок критиков и пользователей используют разные шкалы: критики оценивают игры по 100-балльной системе, в то время как пользователи выставляют оценки по 10-балльной. Это легко исправить, разделив значения оценок критиков на 10.

Original size 1620x266

Код для данной диаграммы

Областная диаграмма, показывающая продажи в разных регионах за каждый год

Original size 1340x719

Областная диаграмма

С помощью данной диаграммы мы видим, что большая часть продаж приходится на Северную Америку и Европу в период, начиная с 1995 года, и на Северную Америку и Японию в период до 1995 года. Также, мы видим уже раннее наблюдавшийся скачок продаж в 2008–2009 годы из-за большого количества выпускаемых игр, а также скачки в продажах в 1987–1989 годы и 1984 году.

Original size 1454x285

Код для данной диаграммы

Описание применения генеративной модели

Для генерации обложки данного проекта была использована нейросеть Ideogram от Google.

Промпт: «A vibrant and immersive digital artwork in a bright cyan color palette with purple accents, inspired by vintage video games».

Также, использовался сервис coolors.co, который помог с определением палитры.

Original size 1460x900

Палитра, полученная через сервис coolors.co

Анализ данных про видеоигры
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more