Original size 1140x1600

[Анализ данных и визуализация] прогноз сердечной недостаточности

PROTECT STATUS: not protected

Ведение

Прогноз сердечной недостаточности

Для анализа я выбрал данные о прогнозе сердечной недостаточности разных странах мира.

Как исследователь, меня заинтересовала тема сердечно-сосудистых заболеваний (ССЗ), которые являются главной причиной смертности в мире. Ежегодно около 17,9 миллионов людей уходят из жизни из-за этих заболеваний, что составляет 31% всех смертей в мире.

Я решил взять возраст от 40 и больше, так как этот возраст является самым критичным для сердечно-сосудистых заболеваний.

Для визуализации данных я выбрал гистограммы, так как они лучше всего позволяют отследить зависимость одного фактора от другого. Цвет выбрал светло-голубой так как он ассоциируется с медициной и спокойствием.

Данные были взяты с ресурса Kaggle

Этапы работы

big
Original size 1497x646

Общий алгоритм при создании графиков:

1. Импорт необходимых библиотек: pandas, matplotlib, seaborn и numpy.

2. Загрузка таблицы 'heart.csv' с помощью 'pd.read_csv ()' в датафрейм 'df'.

3. Применение общих стилистических параметров для построения графиков.

Возраст и анемия

big
Original size 1497x693

Для начала я решил проанализировать взаимоотношение анемии с возрастом. Показатель 1 это наличие анемии, а показатель 0 это отсутствие анемии.

По графику видно, что люди от 50 до 65 больше всего страдают анемией. Людям от 87 и больше меньше всего случаев анемии.

Возраст и диабет

Original size 1552x691

Далее я проанализировал взаимоотношение диабета с возрастом. Показатель 1 это наличие диабета, а показатель 0 это отсутствие диабета.

Данный график иллюстрирует, что больше всего случаев выявления диабета происходит у людей в возрасте от 45 до 75 лет.

Возраст и высокое кровяное давление

Original size 1546x693

После этого я решила выявить взаимосвязь между высоким уровнем кровяного давления и возрастом. Показатель 1 это наличие проблем со здоровьем, а показатель 0 это отсутствие жалоб.

Данный график демонстрирует, что пик заболевания, связанным с повышенным кровяным давлением, приходится возраст от 45 до 65 лет.

Возраст и курение

Original size 1540x691

В завершении, я решила определить влияние курения на заболеваемость. Показатель 1 это наличие проблем со здоровьем, а показатель 0 это отсутствие проблем.

Данный график показывает, что больше всего больных от курения приходится на каждое десятилетие. Мы можем наблюдать что в возрасте 40, 50, 60, 70 и 80 лет ярко выражена данная взаимосвязь.

Описание применения генеративной модели

Для создания обложки применил генератор изображений на основе искусственного интеллекта, а именно Midjourney.

Промпт: «Generate an image showcasing the human heart represented in the form of graphs. The visual should be vertical with a backdrop filled with numerous graphs. The predominant colors in the image should be blue and red, enhancing the overall visual impact.»

[Анализ данных и визуализация] прогноз сердечной недостаточности