Вводная часть
Я очень люблю смотреть фильмы и сериалы. Netflix для меня — как огромная видеотека, где всегда есть что посмотреть. Мне стало интересно: а что вообще есть в этой библиотеке? Откуда берутся все эти фильмы и сериалы? Какие жанры самые популярные? Из каких стран приходит больше всего контента?
Я решила изучить эти данные, чтобы понять:
- Как менялся Netflix за последние годы
- Что чаще добавляют — фильмы или сериалы
- Из каких стран приходят самые интересные проекты
- В какое время года выходит больше всего новинок
Типы графиков:
Типы графиков
- Гистограмма — распределение контента по годам добавления
- Линейный график — динамика добавления контента по месяцам
- Круговая диаграмма — распределение по типам (фильмы/сериалы)
- Горизонтальная гистограмма — топ-10 стран производства
- Тепловая карта — активность добавления контента по годам и месяцам
Этапы работы:
Ключевые технологии: Pandas — работа с таблицами Matplotlib — создание графиков Seaborn — улучшение графиков NumPy — математические операции KaggleHub — загрузка данных, импортируем отдельным кодом с проверкой данных
Цветовая схема: Основной: красный Netflix (#E50914) Акценты: синий, мятный, оранжевый Текст: чёрный (#221F1F) Фон: белый и светло-серый
Также сделала удобный формат просмотра, чтобы графики показывались один за другим. После каждого графика нужно нажать Enter для продолжения. Код каждого графика достаточно объёмный, так как я добавляла оформление букв с цифрами в официальном формате Netflix, с приятной визуализацией в виде кода
Распределение контента Netflix по годам добавления. График построен с 2008 по 2021 год. Гистограмма
Динамика добавления контента Netflix по месяцам. Линейный график Самый активный: Июль Самый тихий: Февраль Среднее в месяц: 726
Распределение контента Netflix по типам. Круговая диаграмма Из 8709 записей мы видим, что преобладают фильмы (70,4%), остальные 29,6% — сериалы
Топ-10 стран по производству контента Netflix. Горизонтальная гистограмма Большее количество вкладывают USA, India и UK
Активность добавления контента Netflix по годам и месяцам. Тепловая карта Всего 8709, из них пиковый месяц был июль 2021- 257 записей
Для работы использовался ИИ Claude AI. Модель: Claude-3 Opus Платформа: https://claude.ai
Как я применяла ИИ:
- Генерация идей по цветовым палитрам — получение рекомендаций по сочетанию цветов, основанных на брендинге Netflix
- Оптимизация кода визуализации — помощь в создании более эффективного кода для matplotlib
- Советы по композиции графиков — рекомендации по расположению элементов для лучшей читаемости
- Статистический анализ — помощь в выборе подходящих статистических методов
Один из промптов, использованных в работе:
«Мне нужно создать визуализацию данных Netflix с фирменной цветовой палитрой. Основной цвет — Netflix red (#E50914). Предложите гармоничную палитру из 5-8 цветов, которая будет хорошо смотреться вместе с основным красным. Также дайте рекомендации по применению этих цветов в разных типах графиков.»
Рекомендованная палитра для Netflix:
- #E50914 — основной красный (для акцентов)
- #B81D24 — темно-красный (для вторичных элементов)
- #221F1F — черный (для текста)
- #F5F5F1 — светлый (для фона)
- #FF6B6B — кораллово-красный
- #118AB2 — синий океана (для контраста)
Применение: — Основной красный: заголовки, важные линии на графиках — Темно-красный: заполнение столбцов гистограмм — Светлый: фон графиков — Синий: для дополнительных линий на графиках
Главные выводы с проекта:
Мы просто взяли данные о фильмах и сериалах Netflix и посмотрели на них под разными углами. Получилась целая история: как платформа росла, что выходит чаще — фильмы или сериалы, из каких стран приходит больше всего контента.
Теперь я могу сделать так же с любыми другими данными. Захочу разобраться с трендами в музыке, игровой индустрии или бизнесе — схема одна и та же. Найти данные, почистить их, построить графики и сделать выводы. Это полезный скилл.
Мы превратили скучные таблицы в понятные графики и истории. И главное — научились этому процессу. Теперь я могу повторить это с любой другой темой, которая меня заинтересует.