
Описание проекта
Тему для данного проекта я выбирала по своим собственным предпочтениям, остановившись на основном хобби — видеоиграх. В данном проекте я проанализирую различные данные видеоигр, например их жанры и годы выпуска, издателей и регионы продаж, что поможет иметь лучшее понимание про рынок видеоигр. Также, я визуализирую эти данные в графиках и диаграммах.
Для выбора базы данных я использовала сайт kaggle.com, на котором нашла нужный мне датасет.

Выбранный датасет на kaggle.com
Этапы работы
Сначала, перед построением графиков, я импортировала все необходимые для дальнейшей работы библиотеки. После этого, я импортировала датасет, с данными которого буду составлять графики и диаграммы.
Я планировала использовать 4 вида диаграмм: - круговую - столбчатую - линейную - областную

Импорт библиотек

Импорт базы данных
Затем, я определила типы данных, предоставленные в датасете. Я заметила, что тип данных для User_Score являлся object, а не float64, что могло помешать при дальнейшей работе.

Определение типов данных
Причина определения User_Score как object, а не float64
Определив, что это произошло из-за наличия ’tbd’ в данных, изменила их на nan и успешно преобразовала User_Score во float64.
Процесс изменения User_Score с object на float64
Далее, я решила перевести названия всех столбцов с английского на русский, чтобы составить понятные диаграммы и графики в дальнейшем. Также, я добавила палитру цветов, которая использовалась при построении диаграмм.
Процесс перевода названий столбцов, добавление палитры
Круговая диаграмма, показывающая использованные в играх жанры
Круговая диаграмма
Данная диаграмма наглядно показывает самые популярные жанры, использованные в выпущенных видеоиграх. Самыми популярными оказались экшн (20.2%), спортивные (14%), ролевые (9%), приключенческие (7.8%) и прочие (10.5%).
Код для данной диаграммы
Столбчатая диаграмма, показывающая топ-10 издателей по продажам
Столбчатая диаграмма
Мы можем наблюдать, что самым популярным издателем по количеству продаж является Nintendo, причем с большим отрывом от других издательств. Между Electronic Arts и Activision тоже довольно-таки большая разница, а вот начиная с 4 места разница в продажах уходит на спад.
Код для данной диаграммы
Линейная диаграмма, показывающая количество выпущенных игр за каждый год
Линейная диаграмма
На диаграмме видно, что самым плодородным в индустрии видеоигр был период с 2008 по 2009 год. Начиная с 1995 года наблюдались небольшие скачки, а из-за недостатка информации в датасете количество игр после 2015 года ушло на резкий спад.
Код для данной диаграммы
Столбчатая диаграмма, показывающая различия средних оценок критиков и пользователей по жанрам
Столбчатая диаграмма
Довольно-таки интересная диаграмма о средних оценках по жанру показывает, что в большинстве своем критики оценивают игры ниже, чем пользователи, за исключением одного случая — спортивных видеоигр. Также, мы можем наблюдать что средние оценки между всеми жанрами и у критиков, и у пользователей не находятся ниже 6 и не превышают 8.
При построении данной диаграммы обнаружилось, что системы оценок критиков и пользователей используют разные шкалы: критики оценивают игры по 100-балльной системе, в то время как пользователи выставляют оценки по 10-балльной. Это легко исправить, разделив значения оценок критиков на 10.
Код для данной диаграммы
Областная диаграмма, показывающая продажи в разных регионах за каждый год
Областная диаграмма
С помощью данной диаграммы мы видим, что большая часть продаж приходится на Северную Америку и Европу в период, начиная с 1995 года, и на Северную Америку и Японию в период до 1995 года. Также, мы видим уже раннее наблюдавшийся скачок продаж в 2008–2009 годы из-за большого количества выпускаемых игр, а также скачки в продажах в 1987–1989 годы и 1984 году.
Код для данной диаграммы
Описание применения генеративной модели
Для генерации обложки данного проекта была использована нейросеть Ideogram от Google.
Промпт: «A vibrant and immersive digital artwork in a bright cyan color palette with purple accents, inspired by vintage video games».
Также, использовался сервис coolors.co, который помог с определением палитры.
Палитра, полученная через сервис coolors.co