Sr. Editor:
Hemos leído con interés el trabajo de Huerta et al1. Consideramos que validar la precisión de cuestionarios de diagnóstico referido es importante desde el punto de vista epidemiológico por sus ventajas (comodidad, tiempo y coste reducido) frente a métodos biométricos y clínicos, pero nos gustaría hacer algunas consideraciones sobre dicho estudio con el fin de contribuir al debate científico y al intercambio de ideas:
1. Aunque los autores afirman que «los entrevistadores estaban bien cualificados», creemos que la utilización de algún procedimiento (p. ej., el índice kappa) para establecer la fuerza de concordancia entre ellos habría contribuido a una mayor fiabilidad del estudio2.
2. En cuanto a la prevalencia de las distintas enfermedades, los autores afirman que «todas las prevalencias referidas son inferiores a las estimadas por el patrón de referencia». Pero, en el caso de la diabetes, los intervalos de confianza (IC) del 95% del patrón y del cuestionario referido se solapan, por lo que no se puede afirmar que las medidas puntuales halladas sean diferentes entre sí.
3. En el artículo se afirma, basándose en el cálculo del índice kappa, que «se ha obtenido un grado de acuerdo entre el diagnóstico referido y el patrón de referencia bueno en diabetes, moderado en HTA y bajo en hiperlipemia». Esto no es correcto ya que, aunque el uso menos conocido del índice kappa es para valorar discrepancias de pruebas diagnósticas, el requisito indispensable para esta utilidad del índice es que la interpretación de las pruebas esté sujeta al factor humano (p. ej., radiografías, electrocardiogramas, muestras de anatomía patológica, etc.)3, lo que no ocurre en este caso, ya que las medidas del patrón de referencia son biométricas, calculadas por aparatos automáticos, calibrados y no sometidos a variabilidad humana en cada medida. Además, se compara el diagnóstico declarado (que es la suma de los datos aportados por varios investigadores no sometidos previamente a ninguna prueba de concordancia entre observadores) con los de la prueba de referencia (que es objetiva desde el punto de vista de variabilidad en cada determinación), por lo que no puede realizarse tal comparación. Además, como las sensibilidades de las tres enfermedades son inferiores al 70%, se sabe, por modelos matemáticos, que con sensibilidades inferiores a este 70% el índice kappa va a resultar necesariamente < 0,4, porque la baja sensibilidad conduce por sí misma a discordancias2.
4. Dado que el estudio trata de valorar la utilidad de una prueba diagnóstica (cuestionario de diagnóstico referido) tomando como estándar los diagnósticos a partir de pruebas biométricas, consideramos que, además del cálculo de sensibilidad, especificidad y valores predictivos, se debería haber calculado los coeficientes de probabilidad positivo (CPP) y negativo (CPN), ya que los valores de sensibilidad y especificidad, a pesar de definir completamente la validez (grado en que un test mide lo que se supone que debe medir) de la prueba diagnóstica, presentan la desventaja de que no proporcionan información relevante a la hora de tomar una decisión clínica ante un determinado resultado de la prueba. Los CPP y CPN expresan un resumen unificado de la sensibilidad y la especificidad y, por lo tanto, no dependen de la prevalencia de la enfermedad en cada lugar y permiten la comparación entre estudios diferentes, a diferencia de los valores predictivos, que sólo valen donde han sido calculados4,5. En este estudio, los CPP y CPN con sus IC del 95% para cada enfermedad (CPP para diabetes, 161,46 [72,21-361,06]; HTA, 15,41 [10,84-21,9]; hiperlipemia, 10,98 [7,07-17,05]; CPN para diabetes, 0,30 [0,24-0,38]; HTA, 0,52 [0,48-0,57]; hiperlipemia, 0,68 [0,64-0,71]) indican que el cuestionario es útil para diagnosticar diabetes e hipertensión (CPP > 10 con IC del 95% relevantes), pero no son útiles para descartarlas (los CPN no son < 0,1). En cuanto a la hiperlipemia, sería necesario plantear más estudios (coeficientes de probabilidad estadísticamente significativos pero no concluyentes clínicamente).
5. Cuando nos referimos a estudios de pruebas diagnósticas, se consideran parámetros óptimos o elevados si son ≥ 80%, por lo que no se puede afirmar que las sensibilidades del estudio lo sean.
En conclusión, debemos ser cuidadosos y metódicos con todos los detalles involucrados en un estudio de investigación, con el fin de contribuir de la forma más eficiente a su comprensibilidad y su utilidad para los investigadores y los clínicos a los que va dirigido.