En teoría de probabilidá, la varianza o variancia (que suel representase como ) d'una variable aleatoria ye una midida de dispersión definida como la esperanza del cuadráu de la esviación de felicidá variable al respective de la so media. O en poques pallabres, ye la media de los residuos al cuadráu.

Varianza
estadístico descriptivo (es) Traducir y momento de orden r (es) Traducir
Cambiar los datos en Wikidata

La so unidá de midida correspuende al cuadráu de la unidá de midida de la variable: por casu, si la variable mide una distancia en metros, la varianza espresar en metros al cuadráu. La varianza tien como valor mínimu 0. La desviación estándar (raigañu cuadráu de la varianza) ye una midida de dispersión alternativa, espresada nes mesmes unidaes que los datos de la variable oxetu d'estudiu.

Hai que tener en cuenta que la varianza puede trate bien influyida polos valores atípicos y nun s'aconseya'l so usu cuando les distribuciones de les variables aleatories tienen coles pesaes. En tales casos encamiéntase l'usu d'otres midíes de dispersión más robustes.

El términu varianza foi acuñáu por Ronald Fisher nun artículu publicáu en xineru de 1919 col títulu The Correlation Between Relatives on the Supposition of Mendelian Inheritance.[1]

Definición

editar

Si tenemos un conxuntu de datos d'una mesma variable, la varianza calcular de la siguiente forma:

 

Siendo:

  •  : cada datu *

 :media de los datos

  •  : númberu de datos

Variable aleatoria

editar

Aplicando esti conceutu a una variable aleatoria con media μ = Y[X], defínese'l so varianza, Var(X) (tamién representada como   o, a cencielles σ2), como

 

Desenvolviendo la definición anterior, llógrase la siguiente definición alternativa (y equivalente):

 

Si una distribución nun tien esperanza, como asocede cola de Cauchy, tampoco tien varianza. Esisten otres distribuciones que, entá teniendo esperanza, escarecen de varianza. Un exemplu d'elles ye la de Pareto cuando'l so índiz k satisfai 1 < k ≤ 2.

Casu continuu

editar

Si la variable aleatoria X ye continua con función de densidá f(x), entós

 

onde :  y les integrales tán definíes sobre'l rangu de X.

Casu discretu

editar

Si la variable aleatoria X ye discreta con pesos x1 ↦ p1, ..., xn ↦ pn y n ye la cantidá total de datos, entós tenemos:

 

onde

  .

Exemplos

editar

Distribución esponencial

editar

La distribución esponencial de parámetru λ ye una distribución continua con soporte nel intervalu [0,∞) y función de densidá

 

Tien media μ = λ−1. Poro, el so varianza ye:

 

Esto ye, σ2 = μ2.

Dadu perfectu

editar

Un dadu de seis cares puede representase como una variable aleatoria discreta que toma, valores del 1 al 6 con probabilidá igual a 1/6. El valor esperáu ye (1+2+3+4+5+6)/6 = 3,5. Poro, el so varianza ye:

 

Propiedaes de la varianza

editar

Delles propiedaes de la varianza son:

  •  
  •   siendo a y b númberos reales cualesquier. D'esta propiedá deduzse que la varianza d'una constante ye cero, esto ye,  
  •  , onde Cov(X,Y) ye la covarianza de X y Y.
  •  , onde Cov(X,Y) ye la covarianza de X y Y.

Varianza muestral

editar

En munches situaciones ye precisu envalorar la varianza d'una población a partir d'una muestra. Si toma una muestra con reemplazu   de n valores d'ella, d'ente tolos estimadores posibles de la varianza de la población de partida, esisten dos d'usu corriente:

 
que la so demostración ye:
 

y : 

que la so demostración ye:
 

Cuando los datos tán arrexuntaos:

 

que la so demostración ye:
 

y : 

que la so demostración ye:
 

A los dos (cuando ta estremáu por n y cuando lo ta por n-1) denominar varianza muestral. Difieren llixeramente y, pa valores grandes de n, la diferencia ye irrelevante. El primeru tresllada direutamente la varianza de la muestra al de la población y el segundu ye un estimador insesgado de la varianza de la población. Ello ye que

 

ente que

 

Propiedaes de la varianza muestral

editar

De resultes de la igualdá  , s2 ye un estadísticu insesgado de  . Amás, si cumplen les condiciones necesaries pa la llei de los grandes númberos, s2 ye un estimador consistente de  .

Entá más, cuando les muestres siguen una distribución normal, pol teorema de Cochran,   tien la distribución chi-cuadráu:

 


Interpretaciones de la varianza muestral

editar

Dexamos tres fórmules equivalentes pal cálculu de la varianza muestral  

  (Demostración xeométrica en http://www.solin.16mb.com/estadistica_js/MediayDesviacion.htm)

Esta última igualdá tien interés pa interpretar los estimadores   y  , pos si quier evaluase la esviación d'unos datos o les sos diferencies, puede optase por calcular el permediu de los cuadraos de les diferencies de cada par de datos:

 . Nótese que'l númberu de sumandos ye  .

O puede considerase el permediu de los cuadraos de les diferencies de cada par de datos ensin tener en cuenta cada datu consigo mesmu, agora'l númberu de sumandos ye  .

 

Ver tamién

editar

Referencies

editar
  1. Fisher, R. A. (1919). «The Correlation Between Relatives on the Supposition of Mendelian Inheritance» Transactions of the Royal Society of Edinburgh Vol. 52, 02, pp 399-433.

Enllaces esternos

editar
  • [1] Simulación de la varianza d'una variable discreta con R (llinguaxe de programación)
  • [www.solin.16mb.com/estadistica_js/MediayDesviacion.htm] Un triángulu rectángulu.