Analís de la regresión

En estadística, l'analís de la regresión ye un procesu estadísticu pa envalorar les rellaciones ente variables. Inclúi munches téuniques pal modeláu y analís de diverses variables, cuando l'atención centrar na rellación ente una variable dependiente y una o más variables independientes (o predictoras). Más específicamente, l'analís de regresión ayuda a entender cómo'l valor de la variable dependiente varia al camudar el valor d'una de les variables independientes, calteniendo'l valor de les otres variables independientes fixes. Más comúnmente, l'analís de regresión envalora la esperanza condicional de la variable dependiente daes les variables independientes - esto ye, el valor permediu de la variable dependiente cuando s'afiten les variables independientes. Con menor frecuencia, l'atención centrar nun cuantil, o otru parámetru de llocalización de la distribución condicional de la variable dependiente daes les variables independientes. En tolos casos, l'oxetivu de la estimación ye una función de les variables independientes llamada la función de regresión. Nel analís de regresión, tamién ye d'interés carauterizar la variación de la variable dependiente en redol a la función de regresión, que puede ser descrita por una distribución de probabilidá.

L'analís de regresión ye llargamente utilizáu pa la predicción y previsión, onde'l so usu tien superposición sustancial nel campu d'aprendizaxe automáticu. L'analís de regresión utilízase tamién pa entender cualos de les variables independientes tán rellacionaes cola variable dependiente, y esplorar les formes d'estes rellaciones. En circunstancies llindaes, l'analís de regresión puede utilizase pa inferir rellaciones causales ente les variables independientes y dependientes. Sicasí, esto puede llevar a ilusiones o rellaciones falses, polo que s'encamienta procuru,[1] por casu, la correllación nun implica causalidá.

Munches téuniques fueron desenvueltes pa llevar a cabu l'analís de regresión. Métodos familiares tales como la regresión llinial y la regresión por cuadraos mínimos ordinarios son paramétricos, en que la función de regresión definir en términos d'un númberu finito de parámetros desconocíos que s'envaloren a partir de los datos. La regresión non paramétrica referir a les téuniques que dexen que la función de regresión consista nun conxuntu específicu de funciones, que puede ser de dimensión infinita.

El desempeñu de los métodos d'analises de regresión na práutica depende de la forma del procesu de xeneración de datos, y cómo se rellaciona col métodu de regresión que s'utiliza. Puesto que la forma verdadera del procesu de xeneración de datos xeneralmente nun se conoz, l'analís de regresión depende de cutiu hasta ciertu puntu de faer camientos alrodiu de esti procesu. Estos supuestos son dacuando comprobables si una cantidá abonda de datos ta disponible. Los modelos de regresión pa la predicción son frecuentemente útiles anque los supuestos sían violaos moderamente, anque nun pueden funcionar de manera óptima. Sicasí, en munches aplicaciones, sobremanera con pequeños efeutos o les cuestiones de causalidá sobre la base de datos observacionales, los métodos de regresión pueden dar resultaos engañoses.[2][3]

Historia editar

La primer forma de regresión foi'l métodu de mínimos cuadraos, que foi publicáu por Legendre en 1805,[4] y por Gauss en 1809.[5] Legendre y Gauss aplicaron el métodu pal problema de determinar, a partir d'observaciones astronómiques, les órbites de los cuerpos alredor del Sol (principalmente cometes, pero tamién más tarde los entós recién descubiertos planetes menores). Gauss publicó un desarrollu posterior de la teoría de los mínimos cuadraos en 1821,[6] incluyendo una versión del teorema de Gauss-Markov.

El términu "regresión" foi acuñáu por Francis Galton nel sieglu XIX pa describir un fenómenu biolóxicu. El fenómenu foi que los altores de los descendientes d'ancestros altos tienden a tornar escontra baxo, escontra un permediu normal (un fenómenu conocíu como regresión escontra la media ).[7][8] Pa Galton, la regresión namái tenía esti significáu biolóxicu,[9][10] pero'l so trabayu foi estendíu más tarde por Udny Yule y Karl Pearson a un contestu estadísticu más xeneral.[11][12] Na obra de Yule y Pearson, la distribución conxunta de la variable respuesta y les variables esplicatives supónse que ye Gaussiana. Esti camientu foi debilitada por Ronald Fisher nes sos obres de 1922 y 1925.[13][14][15] Fisher supón que la distribución condicional de la variable respuesta ye Gaussiana, pero la distribución conxunta non necesariu que lo sía. A esti respectu, l'asunción de Fisher ta más cerca de la formulación de Gauss de 1821.

Nos años 1950 y 1960, los economistes utilizaron calculadores electromecániques pa calcular les regresiones. Antes de 1970, dacuando tomaba hasta 24 hores pa recibir el resultáu d'una regresión.[16]

Los métodos de regresión siguen siendo una área d'investigación activa. Nes últimes décades, nuevos métodos fueron desenvueltos pa regresión robusta, regresión qu'implica respuestes correlacionadas, tales como series de tiempu y les curves de crecedera, regresión na que los predictores (variable independiente) o les variables de respuesta son curves, imáxenes, gráficos y otros oxetos de datos complexos, métodos de regresión qu'acepten dellos tipos de datos faltantes, regresión non paramétrica, métodos de regresión bayesianos, regresión na que les variables predictoras son midíes con error, regresión con más variables predictoras qu'observaciones y la inferencia causal con regresión.

Modelos de regresión editar

Regresión llinial editar

  • Regresión llinial simple

Daes dos variables (Y: variable dependiente; X: independiente) tratar d'atopar una función simple (llinial) de X que nos dexe averar Y por aciu: Ŷ = a + bX

a (ordenada nel orixe, constante)
b (pendiente de la recta)
A la cantidá y=Y denominar residuu o error residual.

Asina, nel exemplu de Pearson: Ŷ = 85 cm + 0,5X

Onde Ŷ ye l'altor predichu del fíu y X l'altor del padre: En media, el fíu gana 0,5 cm por cada cm del padre.
  • Regresión llinial múltiple

Regresión non llinial editar

Ver tamién editar

Referencies editar

  1. «Illusions in Regression Analysis». International Journal of Forecasting (forthcoming) 28 (3):  páxs. 689. 2012. doi:10.1016/j.ijforecast.2012.02.001. http://upenn.academia.edu/JArmstrong/Papers/1162346/Illusions_in_Regression_Analysis. 
  2. David A. Freedman, Statistical Models: Theory and Practice, Cambridge University Press (2005)
  3. R. Dennis Cook; Sanford Weisberg Criticism and Influence Analysis in Regression, Sociological Methodology, Vol. 13. (1982), páxs. 313–361
  4. A.M. Legendre. Nouvelles méthodes pour la détermination des orbites des comètes, Firmin Didot, Paris, 1805. “Sur la Méthode des moindres quarrés” appears as an appendix.
  5. C.F. Gauss. Theoria Motus Corporum Coelestium in Sectionibus Conicis Solem Ambientum. (1809)
  6. C.F. Gauss. Theoria combinationis observationum erroribus minimis obnoxiae. (1821/1823)
  7. Mogull, Robert G. (2004). Second-Semester Applied Statistics. Kendall/Hunt Publishing Company, páx. 59. ISBN 0-7575-1181-3.
  8. Galton, Francis (1989). «Kinship and Correlation (reprinted 1989)». Statistical Science (Institute of Mathematical Statistics) 4 (2):  páxs. 80–86. doi:10.1214/ss/1177012581. 
  9. Francis Galton. "Typical laws of heredity", Nature 15 (1877), 492–495, 512–514, 532–533. (Galton uses the term "reversion" in this paper, which discusses the size of peas.)
  10. Francis Galton. Presidential address, Section H, Anthropology. (1885) (Galton uses the term "regression" in this paper, which discusses the height of humans.)
  11. Yule, G. Udny (1897). «On the Theory of Correlation». Journal of the Royal Statistical Society (Blackwell Publishing) 60 (4):  páxs. 812–54. doi:10.2307/2979746. 
  12. Pearson, Karl; Yule, G.O.; Blanchard, Norman; Lee,Alice (1903). «The Law of Ancestral Heredity». Biometrika (Biometrika Trust) 2 (2):  páxs. 211–236. doi:10.1093/biomet/2.2.211. 
  13. Fisher, R.A. (1922). «The goodness of fit of regression formulae, and the distribution of regression coefficients». Journal of the Royal Statistical Society (Blackwell Publishing) 85 (4):  páxs. 597–612. doi:10.2307/2341124. 
  14. Ronald A. Fisher (1954). Statistical Methods for Research Workers, Twelfth, Edinburgh: Oliver and Boyd. ISBN 0-05-002170-2.
  15. Aldrich, John (2005). «Fisher and Regression». Statistical Science 20 (4):  páxs. 401–417. doi:10.1214/088342305000000331. 
  16. Rodney Ramcharan. Regressions: Why Are Economists Obessessed with Them? March 2006. Accessed 2011-12-03.

Enllaces esternos editar