Original size 512x640

Спорт в цифрах: анализ трендов, карьеры и успеха

PROTECT STATUS: not protected

Спорт — это не только зрелище, но и огромный массив данных, который позволяет анализировать успехи команд, карьерные траектории спортсменов и финансовые закономерности. Я выбрала тему анализа спортивной статистики, потому что она сочетает в себе динамичность, соревновательный дух и интересные закономерности, которые не всегда очевидны на первый взгляд.

Источники данных Для анализа я использовала открытые датасеты, в основном с платформы Kaggle и официальных спортивных сайтов:

Возраст и статистика игроков — FIFA Player Dataset из базы FIFA 23/24. История побед футбольных клубов — взята с Kaggle и Transfermarkt. Зарплаты футболистов — Transfermarkt + ESPN Sports. Олимпийские медали — исторические данные с Olympic.org и Kaggle.

Данные представляют собой таблицы в формате CSV, которые были загружены и анализированы с помощью Pandas и Seaborn.

big
Original size 550x350

Для визуализации данных я выбрала линейный график (для анализа динамики побед топовых футбольных клубов), точечную диаграмму (возраст футболистов и их эффективность), столбчатую диаграмму (сравнение зарплат с их результативностью) и гистограмму (для анализа побед страны-хозяйки Олимпиады с предыдущими годами).

Обработка данных

Для начала я импортировала необходимые мне библиотеки: numpy, matplotlib.pyplot и pandas. После чего считала скачанный csv-файл датасета.

После чего приступила к подготовке данных для точечной диаграммы.

Затем я нашла данные которые содержат информацию об общем рейтинге от FIFA 15 лет до FIFA 21 года. Отсортировав данные под возраст, общий рейтинг и имена спортсменов, был создан новый DataFrame.

Original size 2288x168
Original size 2246x609
Original size 5260x2083

Визуализация данных

import matplotlib.pyplot as plt — библиотека для создания графиков.

Далее создаётся точный график и подписи, а после визуализируется.

Original size 2293x747
Original size 2525x1636

Точечная диаграмма

Второй график

Во втором графике я хотела рассмотреть историю побед футбольных клубов: какие команды доминировали в разные десятилетия?

Для этого мне понадобится линейный график, в котором я ограничусь определенными клубами).

Original size 2289x135
Original size 2285x619
Original size 5260x1519
Original size 2102x216

Дополнительно я использовала цвета ассоциирующиеся с олимпиадными кольцами для приближения к спортивной тематике. Кроме того, цвет индиго в основной части проекта связан с с глубиной стратегии, концентрацией и внутренней силой. Этот оттенок символизирует интуицию, тактическое мышление и дисциплину, что особенно важно в видах спорта, где важны ум, расчетливость и выдержка.

Original size 2083x972

Графическая диаграмма

Третий график

В третьем графике я рассматривала корреляцию заработной платы и результативностью игроков. лучше всего решить эту задачу смогла точечная диаграмма.

Original size 2276x584

Чтобы не добавлять индекс как отдельный столбец:

df = df.reset_index (drop=True)

Original size 2272x1007
Original size 2252x520
Original size 1765x1033

Точечная диаграмма

Четвертый график

В последнем графике было интересно посмотреть на конкретную физическую форму топовых игроков и её связь с ростом.

Параметр веса, возраста и расчета ИМТ будет выражает в значении «Плотность».

Лучше всего с данными было работать в гистограмме.

Original size 2347x1018
Original size 2273x469
Original size 2143x663
Original size 2101x1031

Гистограмма

Заключение

Анализ спортивных данных позволяет выявлять интересные закономерности и тренды, которые могут быть полезны как для профессионалов в индустрии, так и для любителей спорта. В ходе работы были исследованы различные аспекты, такие как возраст и рейтинг спортсменов, их физические характеристики, влияние опыта на успешность и распределение зарплат в разных видах спорта.

Благодаря визуализации данных стало проще увидеть ключевые тенденции и сделать выводы: например, как с возрастом меняется спортивная форма, какие характеристики важны для успеха, и какие факторы влияют на стоимость игрока.

Описание применения искусственного интеллекта

Chat-GPT 4.0 Помог мне на первых этапах с кодом, прояснял некоторые моменты, помогал с улучшением кода, находил и исправлял мелкие ошибки.

Deepseek Проверка кода, исправление неточностей, поиск изображений для проекта в открытом доступе.

Промты

Спорт в цифрах: анализ трендов, карьеры и успеха
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more