Original size 2480x3500

Анализ статистики игроков Премьер-лиги по футболу

PROTECT STATUS: not protected

Вводная часть / Описание

В своем проекте я решила проанализировать статистику игроков Премьер-лиги по футболу за все время. Именно эти данные я выбрала по двум причинам: первое — мне хотелось проанализировать что-либо, связанное со спортом. Второе — подобный анализ позволяет выявить некоторые закономерности в мире футбола, что может быть полезным, например, при попытке предугадать и составить прогнозы на исход новой игры, изменения в составе команд и т. д.

Подобные данные я нашла на сайте Kaggle — платформе, предназначенной для всех интересующихся Data Science.

В своей работе я сделала следующие виды графиков: столбчатые диаграммы, круговые диаграммы и точечные диаграммы. При выборе типа диаграммы я в первую очередь обращала внимание на то, насколько релевантен подобный тип диаграммы анализируемому типу данных, и насколько понятным и наглядным в результате получится отображение.

Этапы работы

Проект включал в себя следующие этапы: для начала я выбрала, какой набор данных хочу проанализировать и по каким критериям, далее, соответственно, шел сам анализ и итоговая визуализация.

Нейросети в своем проекте я не использовала.

Оформление проекта

В проекте использованы следующие цвета (представлены ниже с кодовыми значениями), и шрифт Ysabeau.

big
Original size 3500x916

Обработка данных и итоговые графики

В начале я решила проанализировать самые топовые клубы по их по победам, а именно на столбчатой диаграмме отразить количество побед каждого игрока клуба, отображая его позицию.
Код 1

plt.figure (figsize=(10, 6)) sns.barplot (data=df, x="Club», y="Wins», hue="Position») plt.xticks (rotation=90) plt.title («Кол-во побед у клуба с позициями игроков») plt.xlabel («Клуб») plt.ylabel («Кол-во побед») l = plt.legend () for text in l.get_texts (): text.set_color («white») plt.show ()

Original size 882x895
Далее я с помощью круговой диаграммы решила проанализировать процент игроков на каждой позиции, что наглядно отображает процентное соотношение.
Код 2

top_pos = df['Position'].value_counts ()

plt.figure (figsize=(10, 6)) plt.pie (top_pos, labels=top_pos.index, colors=palette, autopct='%1.1f%%', wedgeprops={"width»: 0.7}) plt.title («Доля игроков по позициям») plt.show ()

Original size 670x513
Теперь я анализирую зависимость побед от поражений, используя точечную диаграмму.
Код 3

plt.figure (figsize=(10, 6)) sns.scatterplot (data=df, x="Wins», y="Losses», hue="Club») plt.title («Зависимость кол-ва побед от кол-ва поражений») plt.xlabel («Кол-во побед») plt.ylabel («Кол-во поражений») plt.legend (loc='upper left', bbox_to_anchor=(1, 1)) plt.show ()

Original size 1324x802
Теперь узнаем самые популярные клубы по кол-ву игроков.
Код 4

top_10_clubs = df['Club'].value_counts ().head (10)

plt.figure (figsize=(10, 6)) sns.barplot (y=top_10_clubs.index, x=top_10_clubs.values, palette=palette) plt.title («Топ 10 клубов по кол-ву игроков») plt.ylabel («Клуб») plt.xlabel («Кол-во игроков») plt.show ()

Original size 1159x577
И, наконец, узнаем какие клубы занимают топ места по забитым голам.
Код 5

top_1o_club_goals = df.groupby ('Club')['Goals'].sum ().nlargest (10) top_1o_club_goals

plt.figure (figsize=(10, 6)) sns.barplot (x=top_1o_club_goals.index, y=top_1o_club_goals.values, palette=palette) plt.title («Топ 10 клубов по кол-ву голов») plt.ylabel («Клуб») plt.xlabel («Кол-во голов»)

for i, val in enumerate (top_1o_club_goals.values): plt.text (i, val, str (val), ha='center', va='bottom')

plt.show ()

Original size 894x577

Ссылки

Анализ статистики игроков Премьер-лиги по футболу
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more