Original size 564x824

Самые продаваемые видеоигры

PROTECT STATUS: not protected

Вводная часть

Данные и источник:

Для анализа мы выбрали датасет о продажах видеоигр (Video Game Sales). Этот датасет взят с платформы Kaggle и содержит информацию об играх, их жанрах, годах релиза, издателях, платформах и глобальных продажах.

Почему эти данные интересны:

Индустрия видеоигр — одна из самых быстрорастущих и динамичных отраслей развлечений. Анализ таких данных позволяет понять эволюцию предпочтений игроков, взлёты и падения отдельных платформ и жанров, а также влияние издателей на рынок. Для нас это ценно, так как позволяет увидеть структурные тенденции и оценить, какие сегменты гейминга были наиболее успешными.

Выбор типов графиков:

Столбчатые диаграммы: Для сравнения категориальных данных (например, топ-жанры, топ-платформы). Линейный график: Для изучения динамики продаж по годам (помогает увидеть тренд во времени). Тепловая карта (Heatmap): Для визуализации распределения продаж в двумерном пространстве «Издатель-Жанр», чтобы выявить «горячие точки».

Этапы работы

1. Загрузка данных

Мы использовали библиотеку Pandas для чтения CSV-файла.

big
Original size 851x191

В главном скрипте (main.py) мы вызываем эту функцию.

big
Original size 405x82

2. Предобработка данных.

Проверили пропуски, удалили строки без года релиза или глобальных продаж, привели столбец с годом к целочисленному типу.

Original size 789x272

3. Анализ данных.

Мы выделили функции для анализа:

Получение топ-жанров по суммарным продажам. Суммарные продажи по годам релиза. Топ-платформы по продажам. Распределение продаж у топ-издателей по жанрам.

Original size 971x471

4. Визуализация и стилизация.

Использовали matplotlib и seaborn. Настроили стили (тема, палитра, шрифт) в plotting.py.

Original size 390x304

Строим графики

Стилизованные графики: Мы вдохновились геймерской эстетикой, выбрав палитру magma (создаёт ярко-контрастный вид) и тёмный фон сетки darkgrid, что напоминает неоновую инфографику. Отсутствие нейросетей — мы обошлись базовыми методами анализа.

Итоговые графики

Original size 1280x768
Original size 1280x768
Original size 1280x768
Original size 1280x768

Результаты сохраняются в папку output:

Top Genres by Global Sales (столбчатая): Показывает, какие жанры наиболее прибыльны. Global Sales by Year of Release (линейный график): Динамика продаж по годам, помогающая увидеть пики популярности. Top Platforms by Global Sales (столбчатая): Какие платформы доминировали на рынке? Sales Distribution by Publisher and Genre (тепловая карта): Взаимосвязь между ведущими издателями и их успешными жанрами.

Структура репозитория:

main.py — основной скрипт (вызов всей логики) data_loader.py, analysis.py, plotting.py, logger_utils.py — модули проекта vgsales.csv — датасет output/ — папка с готовыми графиками logs/ — лог-файлы работы программы

Самые продаваемые видеоигры
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more