Original size 1160x1600

Анализ данных о медалях в Олимпийских играх

PROTECT STATUS: not protected

Вводная часть

Я взял лист, содержащий данные о победах всех наций в Олимпийских играх с 1896 года по 2024 год. Его я нашел на сайте Kaggle, в разделе с дата-сетами, относящимися к спорту. Мне было интересно проанализировать именно такой список, так как я являюсь большим фанатом различных видов спорта, а также с помощью него можно понять, сколько нации за все время участия получили медалей всех степеней, от золотых до бронзовых. Я использовал линейные графики (для отображения динамики изменения количества медалей у лидирующих стран), столбчатые диаграммы (для сравнения количества медалей между странами в конкретный год), круговые диаграммы (для визуализации распределения медалей между странами в определенный год), гистограммы (для анализа распределения общего количества медалей по странам).

Этапы работы

Для начала я устанавливаю библиотеки Pandas, Matplotlib, Seaborn. Затем загружаю .csv c данными об медалях.

big
Original size 370x119

Так как я планирую сделать четыре разных графика, то для каждого я написал свой собственный код. Код для первого линейного графика, демонстрирующий динамику медалей между США, Россией и Китаем за последние 20 лет.

big
Original size 742x390

Затем я написал код для построения круговой диаграммы о распределении медалей в 2024 году по топ-10 странам.

Original size 742x136

Код для столбчатой диаграммы, сравнивающий количество медалей за 2020 и 2024 год стран, входящих в топ-10.

Original size 717x326

Код для гистограммы по общему количеству медалей стран за всю историю, отображающие только топ-10 стран.

Original size 738x202

Графики

Original size 876x548

По графику видно что США держатся в относительной стабильности по динамике общего количества медалей. Китай заработал наибольшее для себя количество в 2008 году, и постепенно приближается с каждой Олимпиадой к тому же числу. А вот Россия перестала участвовать в Олимпиадах после 2016 года, и выступала в нейтральном статусе.

Original size 715x663

Можно видеть что в Играх 2024 года основная доминация была за США, Китаем, Великобританией и Францией.

Original size 1006x608

Большая часть стран выступила в 2024 году лучше, чем в 2020. Япония, Италия, Нидерланды и Германия же наоборот, в 2020 году выступили лучше, чем в 2024.

Original size 858x611

США с огромным отрывом обгоняет другие страны в общем медальном зачете за всю историю Олимпийских игр. Большая часть стран по наибольшему количеству медалей за всю историю — из Европы. Две азиатские страны — Китай и Япония. И одна страна Океании — Австралия.

Описание применения генеративной модели

Для работы я использовал ИИ DeepSeek. Он помог с написанием кода.

Промпты: https://docs.google.com/document/d/1sxadyYJi7afmSgeJnyYgFLFAeBHSXT6Mh--8OPg9ktQ/edit?usp=sharing

Ссылка на модель: https://chat.deepseek.com

Для обложки использовался ИИ Leonadro.Ai (Phoenix 1.0)

Промпт: Olympic Games data analysis

Ссылка: https://app.leonardo.ai

Список источников

Aman Rajput. (2024). Olympics Medal List (1896-2024) [Data set]. Kaggle. https://www.kaggle.com/datasets/amanrajput16/olympics-medal-list-1896-2024?resource=download

Анализ данных о медалях в Олимпийских играх
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more