Использование машинного обучения в диагностике и прогнозировании сахарного диабета (СД) и сердечно-сосудистых заболеваний (ССЗ)
ВВЕДЕНИЕ
Предыдущие исследования показали, что диабет и сердечно-сосудистые заболевания (ССЗ) являются двумя наиболее актуальными хроническими и опасными заболеваниями, которые приводят к смерти во всем мире. По данным Всемирной организации здравоохранения (ВОЗ), по оценкам, в 2019 году от ССЗ умерло 17,9 миллиона человек, что составляет примерно 32% всех смертей в мире, причем 85% этих случаев смерти были вызваны инсультами и сердечными приступами [1-2]. Кроме того, большинство взрослых с диагнозом диабет и преддиабет не знали о состоянии своего здоровья [3], что приводило к летальным исходам, если не лечить на ранних стадиях [4].
Кроме того, существует корреляция между сердечно-сосудистыми заболеваниями и диабетом. Американская кардиологическая ассоциация сообщает, что по меньшей мере 68% людей в возрасте 65 лет и старше, страдающих диабетом, умирают от болезней сердца [5]. Систематический обзор литературы, проведенный Эйнарсоном и др. [6]
СОДЕРЖАНИЕ
ОПРЕДЕЛЕНИЯ, ОБОЗНАЧЕНИЯ И СОКРАЩЕНИЯ 9
ВВЕДЕНИЕ 10
1 АНАЛИЗ ПРОБЛЕМ РАЗРАБОТКИ БИОТЕХНЧЕСКОЙ СИСТЕМ 13
1.1 Анализ Предметной Области 13
1.1.1 Сахарный Диабет 13
1.1.2 Сердечно-сосудистые заболевания 15
1.2 Анализ обзора литературы использования машинного обучение диагностике диабета и ССЗ 18
1.2.1 Сравнивание существующих исследовании в классификации диабета и ССЗ 18
1.2.2 Анализ проблем биомедицинских базы данных 25
1.3 Анализ существующих методов корреляции между ССЗ и диабето 31
1.3.1 Анализ, основанный на медицинском подходе 32
1.3.2 Анализ, основанный на статистическом подходе 33
1.3.3 Анализ, основанный на авто-алгоритмическом подходе 35
2 ТЕОРЕТИЧЕСКИЕ ОСНОВЫ РАЗРАБОТКИ СИСТЕМЫ 38
2.1 Структура Биотехнической Системы 38
2.1.1 Характеристика системы 38
2.2 Характеристика объекта исследования 41
2.2.1 Характеристика объекта исследования 41
2.3 Автоматизированные Алгоритмы И Методы Корреляции 44
2.3.1 Автоматизированные Алгоритмы Машинного Обучения 44
2.3.2 Корреляционный Анализ Объекта Исследования 46
2.4 Показатели Эффективности 47
2.4.1 Параметры оценки эффективности работы классификаторов 47
2.4.2 Методы Валидации 48
3 ПРАКТИЧЕСКАЯ РЕАЛИЗАЦИЯ РАЗРАБОТКИ ПРОГРАММНОГО
КОМПЛЕКСА ДЛЯ ПРОГНОЗИРОВАНИЯ ДИАБЕТА И ССЗ 50
3.1 Структура Реализация Программного Комплекса 50
3.2 Анализ Выполнения Реализация Методов Классификации 53
3.3Анализ И Выводы Выполнения Работы 58
4 СПЕЦИАЛЬНЫЕ ВОПРОСЫ ОБЕСПЕЧЕНИЯ БЕЗОПАСНОСТИ 68
4.1 Требования к медицинскому программному обеспечению 67
4.2 Требования по обеспечению электробезопасности 70
4.3 Требования по обеспечению безопасных условий труда 71
4.3.1Требования к освещению на рабочих местах с компьютером 72
4.3.2 Излучения и поля 73
4.4 Выводы к четвертой главе 74
ЗАКЛЮЧЕНИЕ 75
Список литературы не найден
Рисунок 1.1 – Доля пациентов с диабетом, преддиабетом и сердечно-сосудистыми заболеваниями среди здоровых людей в наборе данных NHANES
Как упоминалось выше, нехватка данных приводит к двум основным проблемам, которые заключаются в дисбалансе набора данных и контроле набора тестов. Другие области, такие как производство, также могут страдать от тех же проблем. Например, дисбаланс классов является классической проблемой в производстве, где количество дефектных компонентов намного меньше, чем количество исправных компонентов. В типичном медицинском сценарии, когда речь идет о здоровом населении, число примеров "нормальных" пациентов будет значительно превышать число пациентов с определенным заболеванием. И это так очевидно в наборе данных NHANES, на рис. 1.1.
Числовые проценты были взяты в зависимости от данных NHANES после предварительной обработки и удаления избыточных значений и значений Nan.