Por qué no utilizar el conocimiento previo: la estadística bayesiana

doi:10.1016/j.recesp.2016.08.032

Ampliar

Vol. 69. Núm. 12.

Páginas 1234-1235 (Diciembre 2016)

Carta al editor
Por qué no utilizar el conocimiento previo: la estadística bayesiana

Why Not Use Existing Knowledge: Bayesian Statistics

Daniel Hernández-Vaqueroa Rocío DíazaJacobo SilvaaCésar Morísa b

Prevalencia de obesidad general y obesidad abdominal en la población adulta española (25–64 años) 2014–2015: estudio ENPE

Rev Esp Cardiol. 2016;69:579-8710.1016/j.recesp.2016.02.010

Javier Aranceta-Bartrina, Carmen Pérez-Rodrigo, Goiuri Alberdi-Aresti, Natalia Ramos-Carrera, Sonia Lázaro-Masedo

Por qué no utilizar el conocimiento previo: la estadística bayesiana. Respuesta

Rev Esp Cardiol. 2016;69:1235-610.1016/j.recesp.2016.09.033

Javier Aranceta-Bartrina, Carmen Pérez-Rodrigo, Natalia Ramos-Carrera, Sonia Lázaro-Masedo

https://doi.org/10.1016/j.recesp.2016.08.032

Ver PDF

Opciones

Contenido relacionado

Otros artículos de interés

Estadísticas

3300 Total PDF

9866 Total HTML

Año/mes	Html	Pdf	Total
2025 Julio	84	14	98
2025 Junio	135	37	172
2025 Mayo	82	35	117
2025 Abril	69	15	84
2025 Marzo	82	16	98
2025 Febrero	72	22	94
2025 Enero	48	37	85
2024 Diciembre	60	16	76
2024 Noviembre	57	31	88
2024 Octubre	70	27	97
2024 Septiembre	103	22	125
2024 Agosto	88	33	121
2024 Julio	54	23	77
2024 Junio	87	13	100
2024 Mayo	66	25	91
2024 Abril	51	28	79
2024 Marzo	62	34	96
2024 Febrero	69	33	102
2024 Enero	69	29	98
2023 Diciembre	70	48	118
2023 Noviembre	63	30	93
2023 Octubre	95	64	159
2023 Septiembre	39	29	68
2023 Agosto	47	18	65
2023 Julio	54	40	94
2023 Junio	90	28	118
2023 Mayo	92	23	115
2023 Abril	45	18	63
2023 Marzo	78	24	102
2023 Febrero	61	23	84
2023 Enero	60	30	90
2022 Diciembre	52	35	87
2022 Noviembre	57	22	79
2022 Octubre	70	35	105
2022 Septiembre	33	30	63
2022 Agosto	25	28	53
2022 Julio	28	21	49
2022 Junio	36	25	61
2022 Mayo	34	35	69
2022 Abril	35	35	70
2022 Marzo	35	32	67
2022 Febrero	27	22	49
2022 Enero	38	26	64
2021 Diciembre	37	27	64
2021 Noviembre	51	35	86
2021 Octubre	54	50	104
2021 Septiembre	43	24	67
2021 Agosto	37	29	66
2021 Julio	32	19	51
2021 Junio	27	25	52
2021 Mayo	70	12	82
2021 Abril	111	74	185
2021 Marzo	81	30	111
2021 Febrero	56	28	84
2021 Enero	74	29	103
2020 Diciembre	71	31	102
2020 Noviembre	59	18	77
2020 Octubre	54	26	80
2020 Septiembre	47	10	57
2020 Agosto	50	14	64
2020 Julio	40	10	50
2020 Junio	32	17	49
2020 Mayo	54	24	78
2020 Abril	85	20	105
2020 Marzo	56	19	75
2020 Febrero	56	9	65
2020 Enero	52	35	87
2019 Diciembre	61	25	86
2019 Noviembre	71	9	80
2019 Octubre	87	12	99
2019 Septiembre	267	30	297
2019 Agosto	64	34	98
2019 Julio	2644	55	2699
2019 Junio	305	78	383
2019 Mayo	123	77	200
2019 Abril	55	39	94
2019 Marzo	79	38	117
2019 Febrero	75	39	114
2019 Enero	82	38	120
2018 Diciembre	95	48	143
2018 Noviembre	125	45	170
2018 Octubre	108	20	128
2018 Septiembre	68	33	101
2018 Agosto	41	24	65
2018 Julio	63	28	91
2018 Junio	86	33	119
2018 Mayo	75	35	110
2018 Abril	60	27	87
2018 Marzo	73	36	109
2018 Febrero	56	31	87
2018 Enero	58	30	88
2017 Diciembre	43	38	81
2017 Noviembre	52	28	80
2017 Octubre	47	33	80
2017 Septiembre	64	33	97
2017 Agosto	73	32	105
2017 Julio	71	21	92
2017 Junio	74	35	109
2017 Mayo	92	56	148
2017 Abril	71	44	115
2017 Marzo	53	42	95
2017 Febrero	61	47	108
2017 Enero	67	43	110
2016 Diciembre	276	158	434

Sr. Editor:

Hemos leído con atención el artículo de Aranceta-Bartrina et al1., cuyo objetivo era «describir las prevalencias de obesidad total y obesidad abdominal en una muestra representativa de la población española».

Suponemos que el objetivo real de los autores no era conocer la prevalencia de obesidad en la muestra obtenida, sino la verdadera prevalencia de obesidad en la población española. Para ello, seleccionaron una muestra de 3.966 pacientes procurando que fuera representativa, y a partir de ella calcularon el porcentaje de pacientes con obesidad. En un intento de extrapolar estos resultados a la población española, calcularon los intervalos de confianza del 95%.

La estadística frecuentista basada en pruebas de significación, intervalos de confianza y contrastes de hipótesis se encuentra ampliamente implementada en nuestros días. Su principal ventaja es que es sencilla y de fácil reproducibilidad, ya que muchos de sus cálculos se pueden realizar a mano. Su principal desventaja es que no contesta de forma racional a preguntas clínicas. A la pregunta inicial: ¿cuál es la verdadera prevalencia de obesidad en la población española?, no se puede contestar de modo inteligible utilizando este tipo de estadística.

Los autores1 señalan que la tasa de obesidad fue del 21,6% (intervalo de confianza del 95%, 19,0-24,2%). Para entender este intervalo, habría que imaginar repetidas muestras extraídas según el mismo modelo de tal forma que el 95% de tales muestras producirían intervalos que incluirían el verdadero valor poblacional2. Aunque resulte difícil de entender, esto no significa que haya un 95% de probabilidades de que la prevalencia de obesos en la población española se encuentre entre el 19 y el 24,2%, por lo que no se resuelve la pregunta inicial.

La estadística bayesiana es la alternativa a la estadística frecuentista. Es más compleja y puede requerir simulaciones de Markov Chain Monte Carlo2,3, pero tiene la ventaja de responder de modo intuitivo a preguntas como la planteada y tener en cuenta el conocimiento previo. En lugar de «intervalo de confianza» se calcula el «intervalo de credibilidad», que es la franja en la que se encuentra, con un 95% de probabilidades, por ejemplo, el verdadero valor poblacional.

Fundamentada en el teorema de Bayes, este tipo de estadística utiliza una probabilidad previa y, junto con el experimento o la observación, calcula una probabilidad a posteriori. Esto haría que no se viera cada estudio como algo separado o independiente del conocimiento previo, sino que añadiría nueva información y contribuiría a la creación de nuevo conocimiento, que sería el punto de partida de los siguientes trabajos2.

Leyendo este artículo1, se recuerda la publicación de Gutiérrez-Fisac et al4. en 2012, cuyo objetivo también era conocer la prevalencia de obesidad en España estudiando a 12.883 individuos. Según los datos aportados, la prevalencia de obesidad en su muestra entre 18 y 64 años fue del 19,78%. La estadística bayesiana permitiría utilizar esto como información previa para posteriormente conseguir un conocimiento más profundo calculando el intervalo de credibilidad.

Así, por ejemplo, utilizando como probabilidad de obesidad a priori una distribución beta (1.898,7700)4, la variable obesidad, una distribución de Bernoulli y juntando los datos obtenidos por Aranceta-Bartrina et al1., después de 12.500 iteraciones y un periodo burn–in de 2.500, se obtendría una prevalencia de obesidad a posteriori del 20,1%, con un intervalo de credibilidad del 95% (19,4-20,8%). Es decir, esta vez sí habría un 95% de posibilidades de que la prevalencia general de obesidad en España se encontrara entre el 19,4 y el 20,8%. La figura representa en forma de histograma la distribución de la obesidad según las simulaciones Markov Chain Monte Carlo.

Figura.

Histograma que representa la variable obesidad después de 12.500 iteraciones Markov Chain Monte Carlo utilizando el algoritmo Metropolis-Hasting.

(0.05MB).

Como se ve, coincide con bastante exactitud con el intervalo de confianza aportado por Aranceta-Bartrina et al1. (19-24,2%), ya que cuando hay poca variación entre los estudios el intervalo de confianza y el de credibilidad se asemejan2. Sin embargo, podría no haber sido así y, si no se utiliza estadística bayesiana, habría 2 opciones: considerar solamente 1 de los trabajos y cerrar los ojos al otro (aun considerando que la metodología de ambos sea correcta) o realizar un tercero que genere mayor evidencia y «desempate», incluso a sabiendas de que ni siquiera responde a nuestra pregunta inicial.

Bibliografía

[1]

J. Aranceta-Bartrina, C. Pérez-Rodrigo, G. Alberdi-Aresti, N. Ramos-Carrera, S. Lázaro-Masedo.

Prevalence of general obesity and abdominal obesity in the spanish adult population (aged 25-64 years) 2014–2015: The ENPE study.

Rev Esp Cardiol., (2016), 69 pp. 579-587

http://dx.doi.org/10.1016/j.rec.2016.02.009 | Medline

[2]

J. Thompson.

The problema of priors.

Bayesian analysis with STATA, Stata Press, pp. 1-8

[3]

M. Gandhi, B. Mukherjee, D. Biswas.

A Bayesian approach for inference from a bridging study with binary outcomes.

J Biopharm Stat., (2012), 22 pp. 935-951

http://dx.doi.org/10.1080/10543406.2012.698436 | Medline

[4]

J.L. Gutiérrez-Fisac, P. Guallar-Castillón, L.M. León-Muñoz, A. Graciani, J.R. Banegas, F. Rodríguez-Artalejo.

Prevalence of general and abdominal obesity in the adult population of Spain, 2008-2010: the ENRICA study.

Obes Rev., (2012), 13 pp. 388-392

http://dx.doi.org/10.1111/j.1467-789X.2011.00964.x | Medline

https://doi.org/10.1016/j.recesp.2016.08.032

Ver PDF

Opciones

Contenido relacionado

Otros artículos de interés

Estadísticas

3300 Total PDF

9866 Total HTML

Año/mes	Html	Pdf	Total
2025 Julio	84	14	98
2025 Junio	135	37	172
2025 Mayo	82	35	117
2025 Abril	69	15	84
2025 Marzo	82	16	98
2025 Febrero	72	22	94
2025 Enero	48	37	85
2024 Diciembre	60	16	76
2024 Noviembre	57	31	88
2024 Octubre	70	27	97
2024 Septiembre	103	22	125
2024 Agosto	88	33	121
2024 Julio	54	23	77
2024 Junio	87	13	100
2024 Mayo	66	25	91
2024 Abril	51	28	79
2024 Marzo	62	34	96
2024 Febrero	69	33	102
2024 Enero	69	29	98
2023 Diciembre	70	48	118
2023 Noviembre	63	30	93
2023 Octubre	95	64	159
2023 Septiembre	39	29	68
2023 Agosto	47	18	65
2023 Julio	54	40	94
2023 Junio	90	28	118
2023 Mayo	92	23	115
2023 Abril	45	18	63
2023 Marzo	78	24	102
2023 Febrero	61	23	84
2023 Enero	60	30	90
2022 Diciembre	52	35	87
2022 Noviembre	57	22	79
2022 Octubre	70	35	105
2022 Septiembre	33	30	63
2022 Agosto	25	28	53
2022 Julio	28	21	49
2022 Junio	36	25	61
2022 Mayo	34	35	69
2022 Abril	35	35	70
2022 Marzo	35	32	67
2022 Febrero	27	22	49
2022 Enero	38	26	64
2021 Diciembre	37	27	64
2021 Noviembre	51	35	86
2021 Octubre	54	50	104
2021 Septiembre	43	24	67
2021 Agosto	37	29	66
2021 Julio	32	19	51
2021 Junio	27	25	52
2021 Mayo	70	12	82
2021 Abril	111	74	185
2021 Marzo	81	30	111
2021 Febrero	56	28	84
2021 Enero	74	29	103
2020 Diciembre	71	31	102
2020 Noviembre	59	18	77
2020 Octubre	54	26	80
2020 Septiembre	47	10	57
2020 Agosto	50	14	64
2020 Julio	40	10	50
2020 Junio	32	17	49
2020 Mayo	54	24	78
2020 Abril	85	20	105
2020 Marzo	56	19	75
2020 Febrero	56	9	65
2020 Enero	52	35	87
2019 Diciembre	61	25	86
2019 Noviembre	71	9	80
2019 Octubre	87	12	99
2019 Septiembre	267	30	297
2019 Agosto	64	34	98
2019 Julio	2644	55	2699
2019 Junio	305	78	383
2019 Mayo	123	77	200
2019 Abril	55	39	94
2019 Marzo	79	38	117
2019 Febrero	75	39	114
2019 Enero	82	38	120
2018 Diciembre	95	48	143
2018 Noviembre	125	45	170
2018 Octubre	108	20	128
2018 Septiembre	68	33	101
2018 Agosto	41	24	65
2018 Julio	63	28	91
2018 Junio	86	33	119
2018 Mayo	75	35	110
2018 Abril	60	27	87
2018 Marzo	73	36	109
2018 Febrero	56	31	87
2018 Enero	58	30	88
2017 Diciembre	43	38	81
2017 Noviembre	52	28	80
2017 Octubre	47	33	80
2017 Septiembre	64	33	97
2017 Agosto	73	32	105
2017 Julio	71	21	92
2017 Junio	74	35	109
2017 Mayo	92	56	148
2017 Abril	71	44	115
2017 Marzo	53	42	95
2017 Febrero	61	47	108
2017 Enero	67	43	110
2016 Diciembre	276	158	434

Carta al editor Por qué no utilizar el conocimiento previo: la estadística bayesiana

Why Not Use Existing Knowledge: Bayesian Statistics

Opciones

Carta al editor
Por qué no utilizar el conocimiento previo: la estadística bayesiana