Исходный размер 1140x1600

Анализ данных Netflix

PROTECT STATUS: not protected
big

Рубрикатор

  1. Описание и актуальность проекта
  2. Анализируемые категории данных
  3. Загрузка и обработка данных — Соотношение количества фильмов и сериалов — Возрастные рейтинги Netflix — Средняя продолжительность фильмов по годам — Анализ просмотров фильмов и сериалов по месяцам — Доля контента, добавленного за последние 5  лет — Топ-10 жанров на Netflix — Распределение сериалов по количеству сезонов
  4. Выводы
  5. Блокнот и датасет
big
Исходный размер 1024x1024

Описание и актуальность проекта

Netflix  — это стриминговая платформа, которая собирает в одном месте множество различных фильмов, сериалов, телепередач и много другое. Netflix известен во всем мире и транслирует свои услуги на различную по возрасту, полу и национальности аудиторию. Из этого вытекает, что данная платформа, так или иначе, оказывает влияние на обширные категории людей, поскольку через фильмы и сериалы люди, во многом, строят свое отношение к ситуациям, формируют ценности и мнения.

Netflix сейчас задает тренды, часто становится примером для молодежи. Получается, что мировоззрение многих молодых людей отчасти зависит от этой платформы. Интересно понять, что по сути представляет из себя эта организация через контент, который она популяризирует, как внутри нее распределяются приоритеты по фильмам и сериалами. Для этого в проекте будут проанализированы базы данных по Netflix и выведена статиста и закономерные выводы.

Анализируемые категории данных

Среди всего обилия возможной информации о платформе, были выбраны следующие категории для анализа:

/1  Соотношение количества фильмов и сериалов /2  Возрастные рейтинги Netflix /3  Средняя продолжительность фильмов по годам /4  Анализ просмотров фильмов и сериалов по месяцам /5  Доля контента, добавленного за последние 5  лет /6  Топ-10 жанров на Netflix /7  Распределение сериалов по количеству сезонов

Были выбраны указанные выше категории данных, поскольку именно они отражают, какой конкретно контент больше всего привлекает потребителей, а также, в каком направлении в последние годы движется платформа, то есть ее вектор развития.

Загрузка и обработка данных

Исходный размер 3500x2480

Сначала были импортированы все необходимые библиотеки для анализа данных, а также был установлен темный цвет фона для графиков, чтобы соответсnвовать основным цветам Netflix. Здесь же указываются все основные части анализа, которые в последствие будут переведены в графики и диаграммы.

/1 Соотношение количества фильмов и сериалов

Исходный размер 3500x1381

В первую очередь, в коде рассчитывается сколько в data frame в колонне type фильмов, а сколько сериалов. Полученные данные визуализируются в график, который затем настраивается по тому, какие значения на какой оси и какая основная цветовая гамма. Как и все выполненные в проекте схемы, эта выполнена в фирменной цветовой гамме платформы.

Исходный размер 2602x1078

Интересным становится то, что Netflix более известен своими сериалами, однако согласно статистике около 70% контента составляют фильмы.

/2 Возрастные рейтинги Netflix

Понимание того, какие возрастные рейтинги наиболее популярны, покажет какая основная аудитория, на которую работает платформа, а также к какому контенту более склонны потребители.

Исходный размер 3500x1381

С помощью библиотеки Seaborn (sns) создается график, в котором по оси x  выводятся виды рейтингов, а по оси y  — их количество.

Исходный размер 2575x1136

Описание возрастных рейтингов

Исходный размер 1551x598

Исходя из всех приведенных данных, можно сделать вывод, что наибольшая часть контента имеет возрастное ограничение TV-MA, что означает контент для взрослых (от 17  лет), который может содержать сцены различного характера, в том числе насилия и запрещенных веществ. Выбор подобных фильмов и сериалов большинством людей может заставить задуматься о негативных последствия контента подобного рода. Однако, второй и третий по популярности возрастные рейтинги TV-PG и ТV-14 говорят о том, что Netflix не пытается работать только на взрослую аудиторию, но привлекает и большое количество подростков.

/3 Средняя продолжительность фильмов по годам

Исходный размер 3500x1381

Импортируем две библиотеки matplotlib.pyplot и seaborn Если в duration_numeric есть данные, код переходит к вычислению средней продолжительности фильмов для каждого года. В коде также распределяются данные, чтобы в график включались только строки, являющиеся фильмами (то есть исключая, например, ТВ-шоу). Затем полученные данные фильтруются по «Году выпуска» и с помощью [«duration_numeric"].mean () вычисляется средняя продолжительность фильмов для каждого года. Результат сохраняется в переменной duration_trend.

Исходный размер 2001x1078

Основные выводы по данным: — Фильмы 1980-1990-х годов были длиннее (в среднем 120  минут). — Современные фильмы (2010-2020-е) короче (около 90-100  минут). — В последние годы наблюдается снижение продолжительности, особенно у фильмов для стриминговых платформ.

Здесь понятна тенденция идущая на снижение продолжительности, поскольку сейчас большинство контента в интернете — это короткие ролики, из-за чего способность удерживать внимание на чем-то одном долгое время падает. Это приводит к тому, что стриминг-платформы подстраиваются под зрителей, которые предпочитают динамичные сюжеты без лишних сцен.

/4 Анализ просмотров фильмов и сериалов по месяцам

Исходный размер 3500x1381

Следующий приведенный график — линейный. Данные сгруппирован на месяц (month_added) и type (Movie или TV  Show). Функция .size () подсчитывает количество добавленных названий для каждой комбинации месяца и типа. .unstack () изменяет структуру данных так, чтобы для фильмов и телешоу вывести два отдельных линейных тренда. Результат сохраняется в переменной monthly_views. Затем создается график сначала для фильмов, а потом для сериалов.

Исходный размер 2592x1081

В итоге, просмотры сериалов достаточно равномерно распределены в течение года, однако среди фильмов можно заметить тенденцию к снижению просмотров в феврале и их максимальное увеличение в декабре. Декабрьский всплеск можно объяснить тем, что Netflix добавляет больше контента к сезону отпусков и новогодних праздников. А также значительный рост фильмов наблюдается в июне и июле, что, возможно, совпадает с выходом летних блокбастеров.

/5 Доля контента, добавленного за последние 5 лет

Исходный размер 3500x1381

Сначала в коде рассчитывается, какой сейчас год, чтобы вывести данные только за последние пять лет. len (recent_content) подсчитывает количество названий, добавленных за последние 5 лет. len (df) подсчитывает общее количество названий в наборе данных. recent_share рассчитывает процентное соотношение названий, добавленных за последние 5 лет, к общему числу названий. Круговая диаграмма создается с помощью plt.pie.

Исходный размер 3500x2480

Около 40-50% всего каталога Netflix было добавлено за последние 5  лет. Это говорит о высокой динамике пополнения контента. Netflix продолжает активно расширять библиотеку, особенно с учетом оригинального контента.

/6 Топ-10 жанров на Netflix

Исходный размер 3500x1381
Исходный размер 2609x977

Среди самых популярных жанров много иностранных фильмов и сериалов (фильмы, в частности, на первом месте). Это показывает, что платформа многонациональна и многокультурна. Драмы располагаются на второй позиции по популярности. Вероятно, из-за того, что они очень разнообразны, а также часто отражают то, что происходит у людей в жизни.

/7 Распределение сериалов по количеству сезонов

Исходный размер 3500x2480
Исходный размер 1710x1091

Большинство сериалов на Netflix имеют только 1  сезон. Это связано с распространенной практикой мини-сериалов и экспериментальных проектов. Количество сериалов с 2  или 3  сезонами значительно меньше, что может свидетельствовать о досрочном закрытия некоторых шоу. Длинные сериалы (с 5+ сезонами) встречаются редко, что объясняется моделью производства контента Netflix, ориентированной на новые проекты.

Выводы

Исходя из всего вышесказанного можно сделать несколько выводов о стратегии Netflix?

Фильмы преобладают, но сериалы становятся важной частью контента. Netflix продолжает расширять производство сериалов, так как они удерживают подписчиков дольше.

Платформа ориентирована на подростков и взрослых зрителей. Высокая доля контента с рейтингами TV-MA и TV-14 подтверждает фокус на взрослую аудиторию. Просмотры фильмов зависят от сезонности, сериалы популярны круглый год. Пик просмотров приходится на декабрь, а летом интерес к фильмам снижается.

Современные фильмы стали короче. Это связано с трендом на более динамичный контент, который легче потреблять. Netflix активно добавляет новый контент, ведь около половины от общего числа фильмов и сериалов было добавлено за последние 5  лет. Это говорит о высокой скорости производства.

Получается, что Netflix успешно адаптируется к трендам индустрии, предлагая разнообразный контент, оптимизированный под потребности зрителей. Компания делает ставку на оригинальные сериалы, частое обновление каталога и сезонные премьеры.

Анализ данных Netflix
Проект создан 23.03.2025
Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную...
Показать больше