Исходный размер 1140x1600

Анализ датасета. Формула-1.

Анализ датасетов о Формуле-1

Тема исследования ориентирована в первую очередь на техническую и тактическую динамику Формулы-1. Мне захотелось узнать больше об истории этого спорта через данные, а также проследить за изменением политики соревнования в сторону более честной и безопасной конкуренции на трассе. Этот анализ позволяет не только выявить текущие тенденции, но и проследить эволюцию надёжности, скорости и стратегий в самом престижном автоспорте мира.

Виды диаграмм

Исходный размер 1344x448

Датасет был взят с открытой платформы Kaggle.

В исследовании я использовала пять типов визуализаций:

— точечную диаграмму (для анализа связи между квалификацией и финишем), — линейный график (для отображения динамики по годам), — круговую диаграмму (для показа долей причин сходов), — корреляционную матрицу (для выявления статистических связей между показателями), — столбчатую диаграмму (для сравнения надёжности команд).

Эти типы графиков были выбраны осознанно: каждый максимально точно отвечает своей аналитической задаче — от выявления трендов до сравнения категорий и отображения пропорций. Обработка данных выполнена с помощью библиотеки Pandas, а визуализация и стилизация — с использованием Matplotlib и Seaborn в среде Google Colab.

Этапы работы

Особое внимание я уделила визуальному оформлению графиков: важно, чтобы результаты были понятны не только специалисту, но и широкой аудитории. Я обратилась к Qwen за помощью с разработкой палитры и окончательному решению насчет шрифта. В итоге выбор пал на DejaVu Sans Mono — за его чёткость, техническую нейтральность и высокую читаемость при работе с цифрами и подписями.

Исходный размер 1514x2064

(1) Точечная диаграмма. Влияние квалификации на победу.

Квалификация не гарантирует высокого результата в гонке. Анализ сезонов 2018–2023 годов показывает, что большинство пилотов теряют позиции после старта — вероятно, из-за напряжённой борьбы в первом повороте, рискованных стратегий пит-стопов или деградации шин. Это означает, что командам недостаточно лишь обеспечить высокую стартовую позицию: ключевым становится умение удерживать её в ходе самой гонки.

(2) Линейный график. Число финишировавших машин по сезонам.

Исходный размер 1189x489
Исходный размер 1632x1164

С течением времени Формула-1 стала значительно безопаснее и технологически надёжнее. Увеличение числа финишировавших машин — прямое следствие комплексных изменений, таких как внедрение систем безопасности и ужесточения регламента. Сегодня почти каждый болид доезжает до финиша.

(3) Круговая диаграмма. Причины схода с дистанции.

Главная угроза — отказ двигателя: он возникает почти в трети всех случаев. Это напрямую указывает на то, что надёжность силовой установки должна быть приоритетом для любой команды, стремящейся к стабильности. Второй по значимости фактор — аварии и столкновения, что подчеркивает важность тактической дисциплины и подготовки пилотов к избеганию контактов. Таким образом, чтобы минимизировать сходы, команде необходимо инвестировать одновременно в два направления: повышение надёжности мотора и развитие навыков безопасного ведения борьбы на трассе.

(4) Корреляционная матрица. Фактор успеха.

Ключ к успеху в Формуле-1 — стабильный финиш в очковой зоне. Данные чётко показывают: чем ниже итоговая позиция, тем меньше очков набирает пилот. Хотя за последнее столетие гонщики стали значительно быстрее — об этом свидетельствует сокращение среднего отставания от победителя — доля финишей в топ-10 не растёт пропорционально. Это указывает на резкий рост конкуренции: даже имея быструю машину, сегодня крайне сложно гарантировать попадание в очки, ведь борьба за каждую позицию стала плотнее, а поле — равномернее.

(5) Линейчатая диаграмма. Доля финишировавших машин по командам.

Надёжность — одно из главных конкурентных преимуществ Red Bull. Команда сочетает высокую скорость с исключительно редкими сходами, что делает её не просто быстрой, а предсказуемо стабильной. В борьбе за титул именно такая сочетаемость скорости и надёжности часто оказывается решающей.

Применение генеративных инструментов

Recraft — генерация обложки и изображений

Qwen — работа над оформлением. Помощь с типографикой и цветами. Корректная организация кода.

Анализ датасета. Формула-1.
Проект создан 16.01.2026
Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную...
Показать больше