Prueba t de Student

En estadística, una prueba t de Student, prueba t-Student, o Test-T ye cualesquier prueba na que l'estadísticu utilizáu tien una distribución t de Student si la hipótesis nula ye cierta. Aplícase cuando la población estudiada sigue una distribución normal pero'l tamañu muestral ye demasiáu pequeñu como por que el estadísticu nel que ta basada la inferencia tea de normal distribuyíu, utilizándose una estimación de la esviación típica en llugar del valor real. Ye utilizáu en analís discriminante.

Historia editar

L'estadísticu t foi introducíu por William Sealy Gosset en 1908, un químicu que trabayaba pa la cervecería Guinness de Dublín. Student yera'l so seudónimu d'escritor.[1][2][3] Gosset fuera contratáu gracies a la política de Claude Guiness de reclutar a los meyores graduaos d'Oxford y Cambridge, y coles mires de aplicar les nueves meyores en bioquímica y estadística al procesu industrial de Guiness.[2] Gosset desenvolvió'l test t como una forma senciella de monitorizar la calidá de la famosa cerveza stout. Publicó'l so test na revista inglesa Biometrika nel añu 1908, pero foi forzáu a utilizar un seudónimu pol so emplegador, pa caltener de callao los procesos industriales que se taben utilizando na producción. Anque ello ye que la identidá de Gosset yera conocida por dellos de los sos compañeros estadísticos.[4]

Usos editar

Ente los usos más frecuentes de les pruebes t atópense:

  • El test de locación d'amosanza única pol cual compruébase si la media d'una población distribuyida de normal tien un valor especificáu nuna hipótesis nula.
  • El test de locación pa dos amosances, pol cual compruébase si les medies de dos poblaciones distribuyíes en forma normal son iguales. Toos estos test son usualmente llamaos test t de Student, a pesar de que puramente falando, tal nome namái tendría de ser utilizáu si les variances de los dos poblaciones estudiaes pueden ser asumíes como iguales; la forma de los ensayos que s'utilicen cuando esta asunción dexar de llau suelen ser llamaos dacuando como Prueba t de Welch. Estes pruebes suelen ser comúnmente nomaes como pruebes t desapareadas o de amosances independientes, por cuenta de que tienen la so aplicación más típica cuando les unidaes estadístiques que definen a dambes amosances que tán siendo comparaes non se superponen.[5]
  • El test d'hipótesis nula pol cual demuéstrase que la diferencia ente dos respuestes midíes nes mesmes unidaes estadístiques ye cero. Por casu, supóngase que se mide'l tamañu del tumor d'un paciente con cáncer. Si'l tratamientu resulta efeutivu, lo esperable sería que'l tumor de munchos pacientes menguara de tamañu depués de siguir el tratamientu. Esto con frecuencia ye referíu como prueba t de midíes apariaes o repitíes.[5][6]
  • El test pa comprobar si la rimada d'una regresión llinial difier estadísticamente de cero.

Estadísticos T y Z editar

La mayor parte de les pruebes estadístiques t tienen la forma  , onde Z y s son funciones de los datos estudiaos. Típicamente, Z diseñar de forma tal que resulte sensible a la hipótesis alternativa (p.ej. que la so magnitú tienda a ser mayor cuando la hipótesis alternativa ye verdadera), ente que s ye un parámetru d'escala que dexa que la distribución de T pueda ser determinada.

Por casu, nuna prueba t d'amosanza única,  , onde   ye la media muestral de los datos, n ye'l tamañu muestral, y σ ye la desviación estándar de la población de datos; s nuna prueba d'amosanza única ye  , onde   ye la esviación estándar muestral.

Les asunciones subxacentes nuna prueba t son:

Nuna prueba t específica, estes condiciones son consecuencies de la población que ta siendo estudiada, y de la forma en que los datos fueron muestreados. Por casu, na prueba t de comparanza de medies de dos amosances independientes, tendríamos de realizar les siguientes asunciones:

  • Caúna de los dos poblaciones que tán siendo comparaes sigue una distribución normal. Esto pue ser demostráu utilizando una prueba de normalidá, tales como una prueba Shapiro-Wilk o Kolmogórov-Smirnov, o puede ser determináu gráficamente per mediu d'un gráficu de cuantiles normales Q-Q plot.
  • Si ta utilizándose la definición orixinal de Student sobre la so prueba t, los dos poblaciones a ser comparaes tienen de tener les mesmes variances, (esto puédese comprobar utilizando una prueba F d'igualdá de variances, una prueba de Levene, una prueba de Bartlett, o una prueba Brown-Forsythe, o envalorala gráficamente per mediu d'un gráficu Q-Q plot). Si los tamaños muestrales de los dos grupos comparaos son iguales, la prueba orixinal de Student ye altamente resistente a la presencia de variances desiguales.[7] La Prueba de Welch ye insensible a la igualdá de les variances, independientemente de si los tamaños d'amosanza son similares.
  • Los datos usaos pa llevar a cabu la prueba tienen de ser muestreados independientemente pa caúna de los dos poblaciones que se comparen. Esto polo xeneral nun ye posible determinalo a partir de los datos, pero si conozse que los datos fueron muestreados de manera dependiente (por casu si fueron muestreados por grupos), entós la prueba t clásica qu'equí s'analiza, puede conducir a resultancies errónees.

Pruebes t pa dos amosances apariaes y desapareadas editar

Les pruebes-t de dos amosances pa probar la diferencia nes medies pueden ser desapareadas o en pareyes. Les pruebes t pareadas son una forma de bloquéu estadísticu, y tienen un mayor poder estadísticu que les pruebes ensin apariar cuando les unidaes apariaes son similares con al respective de los "factores de ruiu" que son independientes de la pertenencia a los dos grupos que se comparen.[ensin referencies] Nun contestu distintu, les pruebes-t apariaes pueden utilizase p'amenorgar los efeutos de los factores de tracamundiu nun estudiu observacional.

Desapareada editar

Les pruebes t desapareadas o de muestres independientes, utilícense cuando se llogren dos grupos de muestres aleatories, independientes y hermano distribuyíes a partir de los dos poblaciones a ser comparaes. Por casu, supóngase que tamos evaluando l'efeutu d'un tratamientu médicu, y reclutamos a 100 suxetos pal estudiu. Depués escoyemos aleatoriamente 50 suxetos pal grupu en tratamientu y 50 suxetos pal grupu de control. Nesti casu, llogramos dos amosances independientes y podríamos utilizar la forma desapareada de la prueba t. La eleición aleatoria nun ye esencial nesti casu, si contautamos a 100 persones per teléfonu y llogramos la edá y xéneru de caúna, y depués utilízase una prueba t bimuestral pa ver en que forma la media d'edaes difier por xéneru, esto tamién sería una prueba t de muestres independientes, a pesar de que los datos son observacionales.

Apariada editar

Les pruebes t de muestres dependientes o apariaes, consisten típicamente nuna amosanza de pares de valores con similares unidaes estadístiques, o un grupu d'unidaes que fueron evaluaes en dos causes distintos (una prueba t de midíes repetitives). Un exemplu típicu de prueba t pa midíes repetitives sería por casu que los suxetos sían evaluaos antes y dempués d'un tratamientu.

Una prueba 't basada na coincidencia de pares muestrales llograr d'una amosanza desapareada que depués ye utilizada pa formar una amosanza apariada, utilizando pa ello variables adicionales que fueron midíes conxuntamente cola variable d'interés.[8]

La valoración de la coincidencia llevar a cabu por aciu la identificación de pares de valores que consisten nuna observación de caúna de les dos amosances, onde les observaciones del par son similares en términos d'otres variables midíes. Esti enfoque utilízase de cutiu nos estudios observacionales p'amenorgar o esaniciar los efeutos de los factores de tracamundiu.

Cálculos editar

Les espresiones esplícites que pueden ser utilizaes pa llograr delles pruebes t danse de siguío. En cada casu, amuésase la fórmula pa una prueba estadística qu'o bien siga esautamente o avere a una distribución t de Student so la hipótesis nula. Amás, danse los apropiaos graos de llibertá en cada casu. Caúna d'estes estadístiques pueden utilizase pa llevar a cabu yá sía un prueba d'una cola o prueba de dos coles.

Una vegada que se determinó un valor t, ye posible atopar un valor p acomuñáu utilizando pa ello una tabla de valores de distribución t de Student. Si'l valor p calulado ye menor a la llende escoyida por significancia estadística (usualmente a niveles de significancia 0,10; 0,05 o 0,01), entós la hipótesis nula refugar en favor de la hipótesis alternativa.

Prueba t p'amosanza única editar

Nesta prueba evalúase la hipótesis nula de que la media de la población estudiada ye igual a un valor especificáu μ0, faise usu del estadísticu:

 

onde   ye la media muestral, s ye la desviación estándar muestral y n ye'l tamañu de l'amosanza. Los graos de llibertá utilizaos nesta prueba corresponder al valor n − 1.

Rimada d'una regresión llinial editar

Supóngase que se ta afaciendo'l modelu:

 

onde xi, i = 1, ..., n son conocíos, α y β son desconocíos, y εi ye l'error aleatoriu nos residuales que s'atopa de normal distribuyíu, con un valor esperáu 0 y una varianza desconocida σ2, y Yi, i = 1, ..., n son les observaciones.

Deseyar probar la hipótesis nula de que la rimada β ye igual a dalgún valor especificáu β0 (de cutiu toma'l valor 0, y nesi casu la hipótesis ye que x y y nun tán rellacionaos).

sía

 

Depués

 

tien una distribución t con n − 2 graos de libertad si la hipótesis nula ye verdadera. L'error estándar de la rimada:

 

puede ser reescritu en términos de los residuales:

 

Depués   atópase dau por:

 

Prueba t pa dos amosances independientes editar

Iguales tamaños muestrales, iguales variances editar

Esta prueba utilízase solamente cuando:

  • los dos tamaños muestrales (esto ye, el númberu, n, de participantes en cada grupu) son iguales;
  • puede asumise que los dos distribuciones tienen la mesma varianza.

Les violaciones a estos presupuestos alderíquense más embaxo.

L'estadísticu t a probar si les medies son distintes puede calculase como sigue:

 

Onde

 ,

ye la desviación estándar combinada, 1 = grupu unu, 2 = grupu 2. El denominador de t ye l'error estándar de la diferencia ente los dos medies.

Por prueba de significancia, los graos de llibertá d'esta prueba llógrense como 2n − 2 onde n ye'l númberu de participantes en cada grupu.

Distintos tamaños muestrales, iguales variances editar

Esta prueba puede utilizase namái si puede asumise que los dos distribuciones tienen la mesma varianza. (Cuando esti presupuestu viólase, mirar más embaxo). L'estadísticu t si les medies son distintes pue ser calculáu como sigue:

 

Onde

 

Nótese que les fórmules de riba, son xeneralizaciones del casu que se da cuando dambes amosances tienen igual tamañu (sustituyendo n por n1 y n2).

  ye un estimador de la esviación estándar común de dambes amosances: esto defínese asina por que'l so cuadráu sía un estimador ensin sesgu de la varianza común sía o non la media iguales. Nesta fórmula, n = númberu de participantes, 1 = grupu unu, 2 = grupo dos. n − 1 ye'l númberu de graos de llibertá pa cada grupu, y el tamañu muestral total menos dos (esto ye, n1 + n2 − 2) ye'l númberu de graos de llibertá utilizaos pa la prueba de significancia.

Distintos tamaños muestrales, distintes variances editar

Esta prueba ye tamién conocida como prueba t de Welch y ye utilizada namái cuando puede asumise que les dos variances poblacionales son distintes (los tamaños muestrales pueden o nun ser iguales) y polo tanto tienen de ser envaloraes por separáu. L'estadísticu t a probar cuando les medies poblacionales son distintes pue ser calculáu como sigue:

 

onde

 

Equí s2 ye'l estimador ensin sesgu de la varianza de les dos amosances, n = númberu de participantes, 1 = grupu unu, 2 = grupo dos. Nótese que nesti casu,   nun ye la varianza combinada. Pal so usu en pruebes de significancia, la distribución d'esti estadísticu ye aproximao igual a una distribución t ordinaria colos graos de llibertá calculaos según:

 

Esta ecuación ye llamada la ecuación Welch–Satterthwaite. Nótese que la verdadera distribución d'esti estadísticu de fechu depende (llixeramente) de dos variances desconocíes.

Prueba t dependiente p'amosances apariaes editar

Esta prueba utilízase cuando les amosances son dependientes; esto ye, cuando se trata d'una única amosanza que foi evaluada dos veces (amosances repitíes) o cuando los dos amosances fueron empareyaes o apariaes. Este ye un exemplu d'un test de diferencia apariada.

 

Pa esta ecuación, la diferencia D ente tolos pares tien que ser calculada. Los pares formáronse yá sía con resultancies d'una persona antes y dempués de la evaluación o ente pares de persones empareyaes en grupos de significancia (por casu, tomaos de la mesma familia o grupu d'edá: vease la tabla). La media (XD) y l'esviación estándar (sD) de tales diferencies utilizáronse na ecuación. La constante μ0 ye distintu de cero si deseyar probar si la media de les diferencies ye significativamente distinta de μ0. Los graos de llibertá utilizaos son n − 1.

Exemplu de pares empareyaos
Par Nome Edá Test
1 Juan 35 250
1 Joana 36 340
2 Jaimito 22 460
2 Jesica 21 200
Exemplu de muestres repitíes
Númberu Nome Test 1 Test 2
1 Miguel 35% 67%
2 Melanie 50% 46%
3 Abeyera 90% 86%
4 Michell 78% 91%

Exemplos desenvueltos editar

Sía A1 denotando un grupu llográu tomando 6 amosances aleatories a partir d'un grupu mayor:

 

y sía A2 denotando un segundu grupu llográu de manera similar:

 

Estos podríen ser, por casu, los pesos de torniellos escoyíos d'un montón.

Vamos llevar a cabu la prueba d'hipótesis cuntando como hipótesis nula de que la media de les poblaciones de les cualos tomemos les amosances son iguales.

La diferencia ente los dos medies de muestres, caúnu denotado por  , que apaez nel numberador en tolos enfoques de dos amosances aldericaes enantes, ye

 

La esviaciones estándar muestrales pa les dos amosances son aproximao 0,05 y 0,11 respeutivamente. P'amosances tan pequeñes, una prueba d'igualdá ente les variances de los dos poblaciones nun ye bien poderosu. Pero yá que los tamaños muestrales son iguales, los dos formes de los dos pruebes t pueden desenvolvese en forma similar nesti exemplu.

Variances desiguales editar

Si decide siguise col enfoque pa variances desiguales (aldericáu enantes), los resultaos son

 

y

 

La resultancia de la prueba estadística ye aproximao 1,959. El valor p pa la prueba de dos coles da un valor averáu de 0,091 y el valor p pa la prueba d'una cola ye aproximao 0,045.

Variances iguales editar

Si se sigue l'enfoque pa variances iguales (aldericáu enantes), los resultaos son

 

y

 

Una y bones el tamañu de les amosances ye igual (dambes tienen 6 elementos), el resultáu de la prueba estadística ye nuevamente un valor que s'avera a 1.959. Por cuenta de que los graos de llibertá son distintes de la prueba pa variances desiguales, los valores P difieren llixeramente de los llograos un pocu más arriba. Equí'l valor p pa la prueba de dos coles ye aproximao 0,078, y el valor p pa una cola ye aproximao 0,039. Asina, si hubiera una bona razón pa creer que les variances poblacionales son iguales, los resultaos seríen daqué más suxerentes d'una diferencia nos pesos medios de los dos poblaciones de torniellos.

Alternatives a la prueba t pa problemes de locación editar

La prueba t aprove un mecanismu exactu pa evaluar la igualdá ente les medies de dos poblaciones que tengan variances iguales, anque'l valor exactu de les mesmes sía desconocíu. El test de Welch ye una prueba aproximao exacta pal casu en que los datos tienen una distribución normal, pero les variances son distintes. P'amosances moderadamente grandes y pruebes d'una cola, l'estadísticu t ye moderadamente robezu a les violaciones de l'asunción de normalidá.[9]

Pa ser exactos tantu les pruebes t como les z rique que les medies de les amosances sigan una distribución normal, y la prueba t adicionalmente rique que la varianza de les amosances siga una distribución Chi-cuadráu (χ2), y que la media muestral y la varianza muestral sían estadísticamente independientes. La normalidá de los valores individuales de los datos nun ye un requisitu por que estes condiciones cumplir. Pol teorema de la llende central, les medies muestrales de muestres moderadamente grandes tamién averen una distribución normal, inclusive si los datos individuales nun tán de normal distribuyíos. Pa datos non normales, la distribución de la varianza muestral puede esviase sustancialmente d'una distribución χ2. Sicasí, si'l tamañu muestral ye grande, el teorema de Slutsky indica que la distribución de les variances muestrales exerz un efeutu bien pequeñu na distribución de la prueba estadística. Si los datos son substancialmente non normales, y el tamañu muestral ye pequeñu, la prueba t puede apurrir resultancies equivocaes.

Cuando l'asunción de normalidá nun se sostién, una alternativa non paramétrica a la prueba t puede ufiertar un meyor poder estadísticu. Por casu, pa dos amosances independientes cuando la distribución de datos ye asimétrica (esto ye, que la distribución ta sesgada) o la distribución tien coles bien grandes, entós el test de suma de posiciones (ranks) de Wilcoxon (conocíu tamién como prueba O de Mann-Whitney) puede tener de trés a cuatro veces mayor poder estadísticu qu'una prueba t.[9][10][11]

La contraparte non paramétrica a la prueba t de muestres apariaes ye la prueba Wilcoxon de suma de posiciones con signu p'amosances pariaes. Pa un discutiniu sobre cuando faer una eleición ente les alternatives t y non paramétricos, consulte a Sawilowsky.[12]

L'analís de varianza "one-way" xeneraliza la prueba t de dos amosances pa casos onde los datos pertenecen a más que dos grupos.

Pruebes multivariadas editar

Una xeneralización del estadísticu t de Student llamada estadísticu t cuadráu de Hotelling, dexa la comprobación d'hipótesis en múltiples (y de cutiu correlacionadas) midíes de la mesma amosanza. Por casu, un investigador puede presentar un númberu de suxetos a un test de múltiples escales de personalidá (p.ej el de cinco grandes traces de personalidá). Por cuenta de que les midíes d'esti tipu suelen tar bien correlacionadas, nun ye aconseyable llevar a cabu delles pruebes univariadas, una y bones esto supondría desdexar la covarianza ente les midíes y encher la probabilidá de refugar falsamente siquier una hipótesis (error de tipu I). Nesti casu una única prueba múltiple ye preferible pa llevar a cabu les pruebes d'hipótesis. L'estadísticu t de Hosteling sigue una distribución T 2, sicasí na práutica, esta distribución utilízase bien raramente, y sicasí suelse convertir nuna distribución de tipu F.

Prueba T 2 monomuestral editar

Pa una prueba multivariable d'única amosanza, la hipótesis ye que'l vector mediu ( ) ye igual a un vector ( ) dau. La prueba estadística defínese como:

 

Onde n ye'l tamañu muestral,   ye'l vector de columnes mediu y   una matriz de covarianza muestral  .

Prueba T 2 bimuestral editar

Pa un test multivariable de dos amosances, la hipótesis ye que los vectores medios ( ,  ) de les dos amosances son iguales. La prueba estadística defínese como:

 

Implementaciones editar

La mayoría de programar tipu fueya de cálculu y paquetes estadísticos de llinguaxes de programación, tales como QtiPlot, OpenOffice.org Calc, LibreOffice Calc, LISREL, Microsoft Excel, SAS, SPSS, Stata, DAP, gretl, R, Python ([1]), PSPP, Infostat y Minitab, y PRISMA6 inclúin implementaciones del test t de Student.

Llectures adicionales editar

  • Boneau, C. Alan (1960). «The effects of violations of assumptions underlying the t test». Psychological Bulletin 57 (1):  páxs. 49–64. doi:10.1037/h0041412 
  • Edgell, Stephen Y., & Noon, Sheila M (1984). «Effect of violation of normality on the t test of the correlation coefficient». Psychological Bulletin 95 (3):  páxs. 576–583. doi:10.1037/0033-2909.95.3.576. 

Referencies editar

  1. Richard Mankiewicz, The Story of Mathematics (Princeton University Press), p.158.
  2. 2,0 2,1 O'Connor, John J.; Robertson, Edmund F., «Prueba t de Student» (n'inglés), MacTutor History of Mathematics archive, Universidá de Saint Andrews, http://www-history.mcs.st-andrews.ac.uk/Biographies/Gosset.html .
  3. Fisher Box, Joan (1987). «Guinness, Gosset, Fisher, and Small Samples». Statistical Science 2 (1):  páxs. 45–52. doi:10.1214/ss/1177013437. 
  4. Raju TN (2005). «William Sealy Gosset and William A. Silverman: two "students" of science». Pediatrics 116 (3):  páxs. 732–5. doi:10.1542/peds.2005-1134. PMID 16140715. 
  5. 5,0 5,1 Fadem, Barbara (2008). High-Yield Behavioral Science (High-Yield Series). Hagerstwon, MD: Lippincott Williams & Wilkins. ISBN 0-7817-8258-9.
  6. Zimmerman, Donald W. (1997). «A Note on Interpretation of the Paired-Samples t Test». Journal of Educational and Behavioral Statistics 22 (3):  páxs. 349–360. 
  7. Markowski, Carol A; Markowski, Edward P. (1990). «Conditions for the Effectiveness of a Preliminary Test of Variance». The American Statistician 44 (4):  páxs. 322–326. doi:10.2307/2684360. 
  8. David, HAI; Gunnink, Jason L (1997). «The Paired t Test Under Artificial Pairing». The American Statistician 51 (1):  páxs. 9–12. doi:10.2307/2684684. 
  9. 9,0 9,1 Sawilowsky S., Blair R. C. (1992). «A more realistic look at the robustness and type II error properties of the t test to departures from population normality». Psychological Bulletin 111 (2):  páxs. 353–360. doi:10.1037/0033-2909.111.2.352. 
  10. Blair, R. C.; Higgins, J.J. (1980). «A comparison of the power of Wilcoxon’s rank-sum statistic to that of Student’s t statistic under various nonnormal distributions.». Journal of Educational Statistics 5 (4):  páxs. 309–334. doi:10.2307/1164905. 
  11. Fay, MP; Proschan, MA (2010). «Wilcoxon-Mann-Whitney or t-test? On assumptions for hypothesis tests and multiple interpretations of decision rules». Statistics Surveys 4:  páxs. 1–39. doi:10.1214/09-SS051. PMID 20414472. PMC 2857732. http://www.i-journals.org/ss/viewarticle.php?id=51. 
  12. Sawilowsky S (2005). «Misconceptions leading to choosing the t test over the Wilcoxon Mann-Whitney O test for shift in location parameter». Journal of Modern Applied Statistical Methods 4 (2):  páxs. 598–600. 
  • O'Mahony, Michael (1986). Sensory Evaluation of Food: Statistical Methods and Procedures. CRC Press, páx. 487. ISBN 0-824-77337-3.
  • Press, William H.; Saul A. Teukolsky, William T. Vetterling, Brian P.
Flannery (1992). Numerical Recipes in C: The Art of Scientific Computing. Cambridge University Press, páx. p. 616. ISBN 0-521-43108-5.

Enllaces esternos editar

Calculadores en llinia editar