Original size 1024x1365

Анализ 97 пород собак

PROTECT STATUS: not protected

О проекте

Собака, несомненно, одно из самых преданных домашних животных, которое становится тем самым человеческим «другом» не только благодаря верности, но и высокой обучаемости и когнитивным способностям. При выборе собаки важнейшую роль играет ее порода.

Так как в ближайшем будущем я бы хотела завести собаку, анализ данных о способностях и особенностях содержания разных пород для меня, как и для многих собачников, актуален.

Кроме того, в своем проекте я хотела получить ответы на следующие вопросы: Живут ли большие собаки меньше? Какие породы собак наиболее подходят для семей? Как связана энергичность и обучаемость? Можно ли оценить сложность ухода по размерам собаки?

В своем исследовании я использовала датасет Dog breeds details (Kaggle). Датасет содержит информацию о 97 разных породах собак и их отличительных особенностях, таких как: продолжительность жизни, вес и рост (отдельно для самок и отдельно для самцов), длина шерсти, игривость, обучаемость. Физические данные: рост, вес, продолжительность жизни Поведенческие оценки: семейность, энергичность, обучаемость (шкала 1-5). Всего 23 характеристики.

big
Original size 1820x1024

Сгенерировано с помощью Recraft: closeup: three different dachshunds are sitting in front of the camera, the background is beige.

Для оформления визуализации я вдохновлялась самыми распространенными оттенкам шерсти собак, поэтому использовала фирменную палитру Warm Neutrals:

D8B799,

7B4B3A,

333333,

F4E9D6,

8AC6DF

\+ акцентный цвет Sky-blue. Шрифт: Comfortaa.

Обработка данных

Методы анализа, которые я использовала: Корреляционный анализ Категоризация по размеру (критерии: <10 кг, 10-25 кг, 25-45 кг, >45 кг) Визуализация данных (matplotlib + seaborn)

Я импортировала необходимые мне библиотеки: pandas, numpy, matplotlib.pyplot, seaborn, warnings. Затем считала csv-файл с датасетом.

Я использовала графики разных видов: Bubble Chart (для наглядной контрастности по всем породам), Lollipop Chart (для более очевидных различий в средней продолжительности жизни), Grouped Bar Chart (чтобы одновременно оценить несколько категорий), Scatter plot (выявить идеальное соотношение энергичности и обучаемости), Stacked bar chart.

0

Обработала данные для наиболее удобного анализа: категоризировала собак по размерам, высчитала среднюю продолжительность жизни, средний вес и размер. Создала категорию пригодности к жизни в семье.

Визуализация данных

1. Размер, вес и долголетие (Bubble Chart)

Original size 2492x1588
Original size 2532x1460

Корреляция -0.664 подтверждает гипотезу — большие собаки действительно живут меньше. Мини породы (голубые точки) концентрируются в верхней левой части графика.

2. Топ-10 пород-долгожителей (Lollipop chart)

Original size 2752x1572
Original size 1994x1422

Интересно, что только 2 из 10 долгожителей относятся к мини категории, однако общая корреляция -0.664 показывает, что размер влияет на продолжительность жизни в масштабе всех пород.

3. Пригодность к жизни в семье (Grouped bar chart)

Семейность рассчитывается как среднее трех показателей: отношение к детям, другим собакам и незнакомцам.

Original size 2410x1576
Original size 2266x1382

Средние породы показывают лучшие семейные качества (4.03), превосходя крупные (3.67), гигантские (3.37) и мини породы (3.30).

4. Энергичность vs Обучаемость (Scatter plot)

Этот график помогает найти породы для активных семей. По осям — энергичность и обучаемость, цвет показывает семейность. Красный прямоугольник выделяет 'идеальную зону' — породы с высокими показателями по всем трем критериям. Это практический инструмент для выбора.

Original size 2348x1572
Original size 2414x1274

Пород в 'идеальной зоне': 25 Примеры идеальных пород: - Labrador Retriever - Boxer - Poodle (Miniature) - Cardigan Welsh Corgi - Cocker Spaniel

Идеальная зона (высокая энергичность + высокая обучаемость + семейность) содержит породы, подходящие для активных семей.

5. Уход за собакой (в зависимости от размера) (Stacked bar chart)

Последний график демонстрирует практическую сторону — сложность ухода. Суммируются три показателя: линька, груминг и слюнотечение. Хорошо видно, что с увеличением размера породы растет и суммарный балл ухода: гигантские породы лидируют, за ними идут крупные, затем средние и, наконец, мини.

Original size 2502x1584
Original size 2344x1424

Сложность ухода по размерам (от простого к сложному): Мини: 5.67 балла Средние: 5.95 балла Крупные: 6.06 балла Гиганты: 6.76 балла

Крупные породы требуют наибольшего ухода, мини породы — наименьшего. Это важный фактор при выборе породы.

Описание применения генеративной модели

Обложка для проекта сгенерирована с помощью Recraft (https://www.recraft.ai/project/45d43350-d56e-490e-bdfc-3d52d77df1a7): several dogs different breeds sitting on the white coach. no people on the background.

Анализ 97 пород собак
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more