Abrir el menú principal

En probabilidá y estadística, la correlación indica la fuercia y la direición d'una rellación llinial y proporcionalidad ente dos variables estadístiques. Considérase que dos variables cuantitatives tán correlacionadas cuando los valores d'una d'elles varien sistemáticamente con al respective de los valores homónimos de la otra: si tenemos dos variables (A y B) esiste correlación ente elles si al menguar los valores d'A facer tamién los de B y viceversa. La correlación ente dos variables nun implica, por sigo mesma, nenguna rellación de causalidá (Vease cum hoc ergo propter hoc).

Fuercia, sentíu y forma de la correlaciónEditar

La rellación ente dos variables cuantitatives queda representada por aciu la llinia de meyor axuste, trazada a partir de la nube de puntos. Los principales componentes elementales d'una llinia d'axuste y, poro, d'una correlación, son la fuercia, el sentíu y la forma:

  • La fuercia estrema según el casu, mide'l grau en que la llinia representa a la nube de puntos: si la nube ye estrecha y allargada, representar por una llinia recta, lo qu'indica que la rellación ye fuerte; si la nube de puntos tien un enclín elípticu o circular, la rellación ye débil.
  • El sentíu mide la variación de los valores de B con al respective de A: si al crecer los valores d'A facer los de B, la rellación ye direuta (pindia positiva); si al crecer los valores d'A mengüen los de B, la rellación ye inversa (pindia negativa).
  • La forma establez el tipu de llinia que define'l meyor axuste: la llinia recta, la curva monotónica o la curva non monotónica

Coeficientes de correlaciónEditar

Esisten diversos coeficientes que miden el grau de correlación, afechos a la naturaleza de los datos. El más conocíu ye'l coeficiente de correlación de Pearson (introducíu en realidá por Francis Galton), que se llogra estremando la covarianza de dos variables ente'l productu de les sos esviaciones estándar. Otros coeficientes son:

Interpretación xeométricaEditar

Daos los valores muestrales de dos variables aleatories   y  , que pueden ser consideraes como vectores nun espaciu a n dimensiones, pueden construyise los "vectores centraos" como:


  y  .

El cosenu del ángulu alfa ente estos vectores ye dáu pola fórmula siguiente:


 

Pos   ye'l coeficiente de correlación muestral de Pearson. El coeficiente de correlación ye'l cosenu del ángulu ente dambos vectores centraos:

  • Si r = 1, l'ángulu  °, dambos vectores son colineales (paralelos).
  • Si r = 0, l'ángulu  °, dambos vectores son ortogonales.
  • Si r =-1, l'ángulu  °, dambos vectores son colineales de direición opuestu.

Más xeneralmente:  .

De xacíu, dende'l puntu vista xeométricu, nun falamos de correlación llinial: el coeficiente de correlación tien siempres un sentíu, cualesquier sía'l so valor ente -1 y 1. Infórmanos de manera precisa, non tantu sobre'l grau de dependencia ente les variables, sinón sobre la so distancia angular na hiperesfera a n dimensiones.

La Iconografía de les correllaciones ye un métodu d'analís multidimensional que reposa nesta idea. La correlación llinial dase cuando nuna nube de puntos atópense o se distribúin alredor d'una recta.

La fórmula de correlación pa dos series distintes con ciertu desfase "k", ta dada pola fórmula:


 

Distribución del coeficiente de correlaciónEditar

El coeficiente de correlación muestral o analíticu d'una amuesa ye de fechu una variable aleatoria, eso significa que si repitimos un esperimentu o consideramos distintes amueses van llograse valores distintos y por tantu'l coeficiente de correlación muestral calculáu a partir d'elles va tener valores llixeramente distintos. P'amueses grandes la variación en dichu coeficiente va ser menor que p'amueses pequeñes. R. A. Fisher foi'l primeru en determinar la distribución de probabilidá pal coeficiente de correlación.

Si los dos variables aleatories que trata de rellacionase vienen de una distribución gaussiana bivariante entós el coeficiente de correlación r sigue una distribución de probabilidá dada por:[1][2]


 

onde:

  ye la distribución gamma
  ye la función gaussiana hipergeométrica.

Nótese que'l valor esperáu del coeficiente de correlación muestral r ye:


 

por tanto, r ye estimador sesgado de  . Puede llograse un estimador averáu non sesgado resolviendo la ecuación:


  pa  

Anque, la solución:


 

ye subóptima. Puede llograse un estimador sesgado con mínima varianza pa grandes valores de n, con sesgu d'orde   buscando'l máximu de la espresión:


 , i.y.  

Nel casu especial de que  , la distribución orixinal pue ser reescrita como:


 

onde   ye la función beta.

ReferenciesEditar

  1. Kenney, J. F. and Keeping, Y. S., Mathematics of Statistics, Pt. 2, 2nd ed. Princeton, NJ: Van Nostrand, 1951.
  2. Correlation Coefficient - Bivariate Normal Distribution

Enllaces esternosEditar