Introducción
José M. de la Torre Hernández
Presidente del Comité Científico del Congreso. Vicepresidente de la SEC
Comités ejecutivo, organizador y científico
Comité de selección de comunicaciones
Listado completo de comunicaciones
Índice de autores
Introducción y objetivos: La enfermedad cardiovascular (ECV) es una causa principal de morbimortalidad a nivel mundial. La predicción temprana del riesgo es esencial para la prevención. Este trabajo presenta un modelo de clasificación con machine learning (ML) para predecir el riesgo de ECV a 10 años (TenYearCHD) utilizando el dataset Framingham heart.csv. Objetivos: desarrollar un modelo de clasificación con machine learning para predecir el riesgo de TenYearCHD. Mejorar la precisión en la identificación de pacientes de alto riesgo. Integrar el modelo en el flujo clínico hospitalario.
Métodos: Dataset: Framingham heart.csv (más de 4.000 registros, 15 atributos). Variables: Datos demográficos (género, edad), factores de riesgo (tabaquismo, cigarrillos/día), antecedentes (medicamentos para la presión arterial, ictus previo, hipertensión, diabetes), registro médico (colesterol total, presión arterial sistólica/diastólica, IMC, frecuencia cardiaca, glucosa). Variable objetivo: riesgo de ECV a 10 años (TenYearCHD). Modelado: Se evaluó regresión logística, SVM (máquina de vectores de soporte), árbol de decisión, random forest, KNN (K-vecinos más cercanos). Se seleccionó random forest (AUC = 0,96). Evaluación: AUC, precisión (89%), sensibilidad, F1-score (89%), validación cruzada. Implementación: Para integrar el modelo en el sistema de información hospitalario (HIS) vía web atendiendo al Reglamento general de protección de datos (RGPD).
Resultados: Las mejores métricas de desempeño con el modelo de random forest: AUC = 0,96, precisión = 89% (validación cruzada). Factores de riesgo importantes: edad, presión arterial sistólica, colesterol total. La implementación facilita la identificación y el manejo del riesgo.
|
Modelos de machine learning evaluados |
|||
|
Modelo |
Accuracy |
AUC |
F1 Score |
|
Regresión logística |
0,645 |
0,696 |
0,645 |
|
SVM |
0,663 |
0,729 |
0,664 |
|
Árbol de decisión |
0,788 |
0,790 |
0,788 |
|
Random forest |
0,892 |
0,962 |
0,890 |
|
KNN |
0,793 |
0,911 |
0,816 |
|
Accuracy: exactitud; AUC: área bajo la curva; SVM: máquina de vectores de soporte; KNN: K-vecinos más cercanos. |

Diagrama de flujo modelo machine learning.
Conclusiones: El modelo random forest predice el riesgo de ECV a 10 años. La integración clínica mejora la estratificación del riesgo y la toma de decisiones personalizadas y en tiempo real. Se requiere validación externa y evaluación del impacto a largo plazo. Además, se deben realizar ajustes de recalibración con datos de la población española e integrar factores omitidos como antecedentes familiares, enfermedad renal crónica e inflamación, triglicéridos, factores socioeconómicos/psicosociales/ambientales y etnia, así como biomarcadores, imagen y genética, usando ML. Esto refinaría la estratificación del riesgo y optimizaría la prevención.