Valor de p
N'oldees d'hipótesis y en estadística xeneral, el valor de p (dacuando conocíu a cencielles como'l p-valor, la p, valor de p conseñáu, o bien direutamente n'inglés p-value) defínese como la probabilidá de llograr un resultáu siquier tan estremu como'l que realmente se llogró (valor del estadísticu calculáu), suponiendo que la hipótesis nula ye cierta, en términos de probabilidá condicional:
Ye fundamental tener en cuenta que'l valor de p ta basáu na asunción de la hipótesis de partida (o hipótesis nula). El valor p ye por tanto una midida de significación estadística.
== Interpretación refuga la hipótesis nula si'l valor de p asociáu al resultáu reparáu ye igual o menor que'l nivel de significación establecíu, convencionalmente 0,05 ó 0,01. Esto ye, el valor p amuésanos la probabilidá de llograr la resultancia que llogremos si suponemos que la hipótesis nula ye cierta.
Si'l valor de p ye inferior al nivel de significación, lo más creíble ye que la hipótesis de partida sía falsa. Sicasí, tamién ye posible que teamos ante una observación atípica, polo que taríamos cometiendo'l error estadísticu de refugar la hipótesis nula cuando ésta ye cierta basándonos en que tuvimos la mala suerte d'atopar una observación atípica. Esti tipu d'errores puede iguase rebaxando'l valor de p; un valor p de 0,05 ye usáu n'investigaciones habituales sociolóxiques ente que valores p de 0,01 utilizar n'investigaciones médiques, nes que cometer un error puede acarretar consecuencies más graves. Tamién puede tratase d'iguar dichu error aumentando'l tamañu de la muestra llograda, lo qu'amenorga la posibilidá de que'l datu llográu sía de casualidá raru.
El valor de p ye un valor de probabilidá, polo que bazcuya ente 0 y 1. Asina, suelse dicir que valores altos de p NUN REFUGUEN la hipótesis nula o, dichu de forma correuta, nun dexen refugar la H0. Otramiente, valores baxos de p refuguen la H0.
Ye importante aprofiar qu'un contraste d'hipótesis nun dexa aceptar una hipótesis; a cencielles refugar o nun la refuga, ye dicir que la tacha de creíble (lo que nun significa obligatoriamente que sía cierta, a cencielles que ye más probable de selo) o inverosímil.
Exemplu
editarSupongamos que dos amigos tán nun chigre y unu diz-y a otru que ye capaz d'estremar un güisqui barato d'unu caru. Como l'otru amigu nun lo cree, deciden faer una prueba. L'amigu bravucón diz qu'atina qué tipu de güisqui ta tomando siquier el 90% de les vegaes, yá que dacuando los xelos aburúyen-y la cata. Deciden face-y probar 20 güisquis (en díes distintos) y llogren la resultancia de qu'atinó sobre'l conteníu del vasu que taba probando en 14 nueches. Yá que el nuesu amigu dixo qu'atinaría'l 90% de les vegaes y namái atinó'l 70% d'elles (14 de 20 nueches), ¿podemos creer al nuesu amigu, o nos ta engañando? ¿ye posible que fallara por mala suerte, pero si dexámos-y siguir intentándolo a la llarga va atinar el 90%? Ta claro que si atinara toles nueches, o 19 d'elles creeríamoslu ensin batura a duldes, tamién si fallara toes o casi toes desmentiríamos-y ensin duldar, pero con 14 sobre 20 ye daqué dudosu. Esto ye lo que podemos midir col valor de p.
Si suponemos que la hipótesis nula ye cierta, esto quier dicir que les cates del nuesu amigu distribuyir según una binomial de parámetru 0,90, esto ye, como una moneda que saliera cara'l 90% de les vegaes y cruz el 10%. ¿Cuál ye la probabilidá de qu'una distribución binomial de parámetru 0,9 repitida 20 vegaes déanos como resultáu 14 cares y 6 cruces? Calculando esa probabilidá quédanos p = 0,008867 ≃ 0,89%.
Si a esti valor sumámoslu la probabilidá de qu'atine namái 13 vegaes, más la probabilidá de qu'atine namái 12 vegaes y asina hasta la probabilidá de que nun atine nenguna vegada, ye dicir la probabilidá de qu'atine 14 o menos vegaes esto danos p = 0,011253 ≃ 1,13%. Este ye'l valor de p.
¿Qué significa esto? Esto significa que si realmente suponemos que'l nuesu amigu atina'l 90% de les vegaes que prueba una copa y probó 20 copes, la probabilidá de qu'atine menos de 15 copes ye del 1,13%. Por tanto, si damos una potencia de contraste avezáu de 0,05, que significa qu'aceptamos equivocar el 5% de les vegaes si repitiéramos l'esperimentu, como'l valor de p ye inferior a la potencia del contraste, refugamos la hipótesis nula, y declaramos que'l nuesu amigu ye un fanfarrón. Estadísticamente, esto facer porque la resultancia reparada (14 aciertos de 20 intentos) ye bien pocu probable si suponemos qu'atina'l 90% de les vegaes, polo tanto asumimos que nun yera cierta la hipótesis nula.
¿Que pasara si atinara les 20 vegaes? Nesi casu'l valor de p saldría bien alto, yá que ye bien probable qu'una distribución binomial de parámetru 0,90 repitida 20 vegaes déanos 20. Por tanto nun refugamos la hipótesis nula. Esto ye, diríamos que ye creíble qu'atine'l 90% de les vegaes, ye posible que lleve razón, nun tenemos evidencies significatives en contra d'ello yá que el p-valor resultónos bien favorable.
El valor p ye la probabilidá de que de la población propuesta pola hipótesis nula llógrese la muestra reparada o una entá más alloñada. El valor p ta rellacionáu cola probabilidá d'error de tipu I.
Principios pal correutu usu ya interpretación del valor de p
editarEn 2016, l'American Statistical Association publicó seis principios pal correutu usu ya interpretación del valor de p. Munchos d'estos principios enceten concepciones equivocaes y emplegos erróneos. Los seis principios son los siguientes:[1] [2] [3]
- Los valores de p pueden indicar cómo son los datos d'incompatibles con ciertu modelu estadísticu.
- Los valores de p nun miden la probabilidá de que la hipótesis nula sía cierta, nin tampoco la probabilidá de que los datos fueren producíos dafechu al azar.
- Conclusiones científiques y decisiones polítiques o empresariales nun tendríen de basar se namái nel fechu de qu'un valor de p p supere un estragal especificáu.
- Una inferencia apropiada implica un informe completu y tresparencia.
- Nin el valor de p p nin la significación estadística miden el tamañu d'un efeutu o la importancia d'una resultancia.
- En sí mesmu, un valor de p p nun ye una midida apropiada de la evidencia d'un modelu o hipótesis.
Referencies
editar- ↑ Wasserstein RL, Lazar NA (2016). «The RUSTI's statement on p-values: context, process, and purpose». The American Statistician. doi:. http://dx.doi.org/10.1080/00031305.2016.1154108.
- ↑ Sterne JAC, Smith GD (2001). «Sifting the evidence — what's wrong with significance tests?». BMJ 322 (7280): páxs. 226–231. doi: . PMID 11159626. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pubmed&pubmedid=11159626.
- ↑ Schervish MJ (1996). «P Values: What They Are and What They Are Not». The American Statistician 50 (3): páxs. 203-206. doi:. http://www.jstor.org/sici?sici=0003-1305(199608)50%3A3%3C203%3APVWTAA%3Y2.0.CO%3B2-0.