ISSN: 0300-8932 Factor de impacto 2023 7,2
Vol. 62. Núm. 10.
Páginas 1204-1205 (Octubre 2009)

Algunas consideraciones sobre la interpretación de resultados de estudios de pruebas diagnósticas: estudio DINO

Some Thoughts on How to Interpret the Results of Studies on Diagnostic Tests: The DINO Study

Álvaro Campillo-SotoaRamón Lirón-RuizaJuan Gervasio Martín-LorenzoaJosé Luis Aguayo-Albasinia

Opciones

Sr. Editor:

Hemos leído con interés el trabajo de Huerta et al1. Consideramos que validar la precisión de cuestionarios de diagnóstico referido es importante desde el punto de vista epidemiológico por sus ventajas (comodidad, tiempo y coste reducido) frente a métodos biométricos y clínicos, pero nos gustaría hacer algunas consideraciones sobre dicho estudio con el fin de contribuir al debate científico y al intercambio de ideas:

1. Aunque los autores afirman que «los entrevistadores estaban bien cualificados», creemos que la utilización de algún procedimiento (p. ej., el índice kappa) para establecer la fuerza de concordancia entre ellos habría contribuido a una mayor fiabilidad del estudio2.

2. En cuanto a la prevalencia de las distintas enfermedades, los autores afirman que «todas las prevalencias referidas son inferiores a las estimadas por el patrón de referencia». Pero, en el caso de la diabetes, los intervalos de confianza (IC) del 95% del patrón y del cuestionario referido se solapan, por lo que no se puede afirmar que las medidas puntuales halladas sean diferentes entre sí.

3. En el artículo se afirma, basándose en el cálculo del índice kappa, que «se ha obtenido un grado de acuerdo entre el diagnóstico referido y el patrón de referencia bueno en diabetes, moderado en HTA y bajo en hiperlipemia». Esto no es correcto ya que, aunque el uso menos conocido del índice kappa es para valorar discrepancias de pruebas diagnósticas, el requisito indispensable para esta utilidad del índice es que la interpretación de las pruebas esté sujeta al factor humano (p. ej., radiografías, electrocardiogramas, muestras de anatomía patológica, etc.)3, lo que no ocurre en este caso, ya que las medidas del patrón de referencia son biométricas, calculadas por aparatos automáticos, calibrados y no sometidos a variabilidad humana en cada medida. Además, se compara el diagnóstico declarado (que es la suma de los datos aportados por varios investigadores no sometidos previamente a ninguna prueba de concordancia entre observadores) con los de la prueba de referencia (que es objetiva desde el punto de vista de variabilidad en cada determinación), por lo que no puede realizarse tal comparación. Además, como las sensibilidades de las tres enfermedades son inferiores al 70%, se sabe, por modelos matemáticos, que con sensibilidades inferiores a este 70% el índice kappa va a resultar necesariamente < 0,4, porque la baja sensibilidad conduce por sí misma a discordancias2.

4. Dado que el estudio trata de valorar la utilidad de una prueba diagnóstica (cuestionario de diagnóstico referido) tomando como estándar los diagnósticos a partir de pruebas biométricas, consideramos que, además del cálculo de sensibilidad, especificidad y valores predictivos, se debería haber calculado los coeficientes de probabilidad positivo (CPP) y negativo (CPN), ya que los valores de sensibilidad y especificidad, a pesar de definir completamente la validez (grado en que un test mide lo que se supone que debe medir) de la prueba diagnóstica, presentan la desventaja de que no proporcionan información relevante a la hora de tomar una decisión clínica ante un determinado resultado de la prueba. Los CPP y CPN expresan un resumen unificado de la sensibilidad y la especificidad y, por lo tanto, no dependen de la prevalencia de la enfermedad en cada lugar y permiten la comparación entre estudios diferentes, a diferencia de los valores predictivos, que sólo valen donde han sido calculados4,5. En este estudio, los CPP y CPN con sus IC del 95% para cada enfermedad (CPP para diabetes, 161,46 [72,21-361,06]; HTA, 15,41 [10,84-21,9]; hiperlipemia, 10,98 [7,07-17,05]; CPN para diabetes, 0,30 [0,24-0,38]; HTA, 0,52 [0,48-0,57]; hiperlipemia, 0,68 [0,64-0,71]) indican que el cuestionario es útil para diagnosticar diabetes e hipertensión (CPP > 10 con IC del 95% relevantes), pero no son útiles para descartarlas (los CPN no son < 0,1). En cuanto a la hiperlipemia, sería necesario plantear más estudios (coeficientes de probabilidad estadísticamente significativos pero no concluyentes clínicamente).

5. Cuando nos referimos a estudios de pruebas diagnósticas, se consideran parámetros óptimos o elevados si son ≥ 80%, por lo que no se puede afirmar que las sensibilidades del estudio lo sean.

En conclusión, debemos ser cuidadosos y metódicos con todos los detalles involucrados en un estudio de investigación, con el fin de contribuir de la forma más eficiente a su comprensibilidad y su utilidad para los investigadores y los clínicos a los que va dirigido.

Bibliografía
[1]
Huerta JM, Tormo MJ, Egea-Caparrós JM, Ortolá-Devesa JB, Navarro C..
Validez del diagnóstico referido de diabetes, hipertensión e hiperlipemia en población adulta española. Resultados del estudio DINO..
Rev Esp Cardiol, (2009), 62 pp. 143-52
[2]
Saturno PJ..
La construcción de criterios para evaluar la calidad. En: Saturno PJ, editor. Evaluación y mejora de la calidad en Servicios de Salud..
Conceptos y métodos,
[3]
Sackett DL..
El examen clínico. En: Sackett DL, Haynes RB, Guyatt GH, Tugwell A, editores. Epidemiología clínica..
Ciencia basica para la medicina clínica, (Boston: Panamericana), 1997. p. 34-61
[4]
Escrig-Sos J, Martínez-Ramos D, Miralles-Tena JM..
Pruebas diagnósticas: nociones básicas para su correcta interpretación y uso..
Cir Esp, (2006), 79 pp. 267-73
[5]
Díaz Guzmán. ..
Investigación clínica. Diagnóstico. En: Diploma Superior en Metodología de la Investigación. 3..
a ed, (Madrid: Instituto de Salud Carlos III), 2008. p. 1-55
¿Es usted profesional sanitario apto para prescribir o dispensar medicamentos?