Distribución normal multivariante

Distribución normal multivariante
Parámetros	(vector real); matriz de covarianza (matriz real definida positiva de dimensión )
Función de densidá (pdf)	;
Función de distribución (cdf)	Ensin espresión analítica
Media
Mediana
Moda
Varianza
Coeficiente de simetría	0
Curtosis	0
Entropía
Función xeneradora de momentos (mgf)
Función característica
	[editar datos en Wikidata]

En probabilidá y estadística, una distribución normal multivariante, tamién llamada distribución gaussiana multivariante, ye una xeneralización de la distribución normal unidimensional a dimensiones cimeres.

Casu xeneral

Un vector aleatoriu $\ X=[X_{1},\dots ,X_{n}]^{T}$ sigue una distribución normal multivariante si satisfai les siguientes condiciones equivalentes:

Toa combinación llinial $\ Y=a_{1}X_{1}+\cdots +a_{n}X_{n}$ ta de normal distribuyida.
Hai un vector aleatoriu $\ Z=[Z_{1},\dots ,Z_{m}]^{T}$ , que les sos componentes son variables aleatories independientes distribuyíes según la normal estándar, un vector $\ \mu =[\mu _{1},\dots ,\mu _{n}]^{T}$ y una matriz $n\times m$ $\ A$ tal que $\ X=AZ+\mu$ .
Hai un vector $\mu$ y una matriz semidefinida positiva simétrica $\ \Sigma$ tal que la función carauterística de X ye

\phi _{X}\left(o;\mu ,\Sigma \right)=\exp \left(i\mu ^{\top }o-{\frac {1}{2}}o^{\top }\Sigma o\right).

Si $\ \Sigma$ ye una matriz non singular, entós la distribución puede describise pola siguiente función de densidá:

$f_{X}(x_{1},\dots ,x_{n})={\frac {1}{(2\pi )^{n/2}|\Sigma |^{1/2}}}\exp \left(-{\frac {1}{2}}({\mathbf {x}}-{\mathbf {\mu }})^{\top }\Sigma ^{-1}({\mathbf {x}}-{\mathbf {\mu }})\right)$

onde $\ \left|\Sigma \right|$ ye'l determinante de $\ \Sigma$ . Nótese como la ecuación de riba amenórgase a la distribución normal si $\ \Sigma$ ye un esguilar (esto ye, una matriz 1x1).

El vector μ nestes circunstancies ye la esperanza de X y la matriz $\ \Sigma =AA^{T}$ ye la matriz de covarianza de les componentes X_i.

Ye importante entender que la matriz de covarianza puede ser singular (anque nun tea asina descrita pola fórmula de riba, pa la cual $\ \Sigma ^{-1}$ ta definida).

Esti casu apaez con frecuencia en estadística; por casu, na distribución del vector de residuos en problemes ordinarios de regresión llinial. Nótese tamién que los X_i son polo xeneral non independientes; pueden trate como la resultancia d'aplicar el tresformamientu llinial A a una coleición de variables normales Z.

Esta distribución d'un vector aleatoriu X que sigue una distribución normal multivariante pue ser descrita cola siguiente notación:

$X\ \sim {\mathcal {N}}(\mu ,\Sigma ),$

o faer esplícitu que X ye n-dimensional,

$X\ \sim {\mathcal {N}}_{N}(\mu ,\Sigma ).$

Función de distribución

La función de distribución $F(x)$ defínese como la probabilidá de que tolos valores d'un vector aleatoriu $X$ sían menores o iguales que los valores correspondientes d'un vector $x$ . Anque F nun tenga una fórmula, hai una serie d'algoritmos que dexen envalorala numbéricamente.^[1]

Un contraejemplo

El fechu de que dos variables aleatories X y Y sigan una distribución normal, caúna, nun implica que'l par (X, Y) siga una distribución normal conxunta. Un exemplu simple dar con X Normal(0,1), Y = X si |X| > 1 y Y = −X si |X| < 1. Esto tamién ye ciertu pa más de dos variables aleatories.^[2]

De normal distribuyíes ya independencia

Si X y Y tán de normal distribuyíes y son independientes, la so distribución conxunta tamién ta de normal distribuyida, esto ye, el par (X, Y) tien de tener una distribución normal bivariante. Sía que non, un par de variables aleatories de normal distribuyíes nun tienen por qué ser independientes al ser consideraes de forma conxunta.

Caso bivariante

Nel casu particular de dos dimensiones, la función de densidá (con media (0, 0) ye

f(x,y)={\frac {1}{2\pi \sigma _{x}\sigma _{y}{\sqrt {1-\rho ^{2}}}}}\exp \left(-{\frac {1}{2(1-\rho ^{2})}}\left({\frac {x^{2}}{\sigma _{x}^{2}}}+{\frac {y^{2}}{\sigma _{y}^{2}}}-{\frac {2\rho xy}{(\sigma _{x}\sigma _{y})}}\right)\right)

onde $\rho$ ye'l coeficiente de correlación ente $X$ y $Y$ . Nesti casu,

\Sigma ={\begin{bmatrix}\sigma _{x}^{2}&\rho \sigma _{x}\sigma _{y}\\\rho \sigma _{x}\sigma _{y}&\sigma _{y}^{2}\end{bmatrix}}.

Tresformamientu allegáu

Si $Y=c+BX\,$ ye una tresformamientu allegáu de $X\ \sim {\mathcal {N}}(\mu ,\Sigma ),$ onde $c\,$ ye un $M\times 1$ vector de constantes y $B\,$ una $M\times N$ matriz, entós $Y\,$ tien una distribución normal multivariante con esperanza $c+B\mu \,$ y varianza $B\Sigma B^{T}\,$ esto ye, $Y\sim {\mathcal {N}}\left(c+B\mu ,B\Sigma B^{T}\right)$ . En particular, cualquier subconxuntu de les $X_{i}\,$ tien una distribución marxinal que ye tamién una normal multivariante.

Pa ver esto, considérese'l siguiente exemplu: pa estrayer el subconxuntu $(X_{1},X_{2},X_{4})^{T}\,$ , úsese

B={\begin{bmatrix}1&0&0&0&0&\ldots &0\\0&1&0&0&0&\ldots &0\\0&0&0&1&0&\ldots &0\end{bmatrix}}

lo qu'estrayi direutamente los elementos deseyaos.

Otru corolariu sería que la distribución de $Z=b\cdot X$ , onde $b$ ye un vector del mesmu llargor que $X$ y el puntu indica un productu vectorial, sería una distribución gaussiana unidimensional con $Z\sim {\mathcal {N}}\left(b\cdot \mu ,b^{T}\Sigma b\right)$ . Esta resultancia llógrase usando

B={\begin{bmatrix}b_{1}&b_{2}&\ldots &b_{n}\\0&0&\ldots &0\\\vdots &\vdots &\ddots &\vdots \\0&0&\ldots &0\end{bmatrix}}

y considerando namái la primer componente del productu (la primer fila de $B$ ye'l vector $b$ ). Reparar cómo la definición positiva de $\Sigma$ implica que la varianza del productu vectorial tendría de ser positiva.

Interpretación xeométrica

Les curves de equidensidad d'una distribución normal multivariante son elipsoides (esto ye, tresformamientos lliniales d'hiperesferes) centraos na media.^[3] Les direiciones de les exes principales de los elipsoides vienen daos polos vectores propios de la matriz de covarianza $\Sigma$ . Los llargores relativos de los cuadraos de les exes principales vienen daos polos correspondientes vectores propios.

Si $\Sigma =O\Lambda O^{T}=O\Lambda ^{1/2}(O\Lambda ^{1/2})^{T}$ ye una descomposición espectral onde les columnes d'O son vectores propios unitarios y $\Lambda$ ye una matriz diagonal de valores propios, entós tenemos

X\ \sim N(\mu ,\Sigma )\iff X\ \sim \mu +O\Lambda ^{1/2}N(0,I)\iff X\ \sim \mu +UN(0,\Lambda ).

Amás, O puede escoyese talmente que seya una matriz de rotación, tal qu'invirtiendo una exa nun tenga nengún efeutu en $N(0,\Lambda )$ , pero invirtiendo una columna, camude'l signu del determinante de O'. La distribución $N(\mu ,\Sigma )$ ye n'efeutu $N(0,I)$ esguilada por $\Lambda ^{1/2}$ , rotada por O y treslladada por $\mu$ .

Recíprocamente, cualquier eleición de $\mu$ , matriz de rangu completu O, y valores diagonales positivos $\Lambda _{i}$ dexa'l pasu a una distribución normal non singular multivariante. Si cualesquier $\Lambda _{i}$ ye cero y O ye cuadrada, la matriz de covarianza $O\Lambda O^{T}$ ye una singular. Geométricamente esto significa que cada curva elipsoide ye infinitamente delgada y tien volume cero nun espaciu n-dimensional, según, siquier, unu de les principales exes tien longitud cero.

Correlaciones ya independencia

Polo xeneral, les variables aleatories pueden ser incorreladas, pero altamente dependientes. Pero si un vector aleatoriu tien una distribución normal multivariante, entós cualesquier dos o más de los sos componentes que sían incorreladas, son independientes.

Pero non ye ciertu que dos variables aleatories que tán (xebradamente, marginalmente) de normal distribuyíes y incorreladas sían independientes. Dos variables aleatories que tán de normal distribuyíes pueden que nun lo tean conxuntamente. Pa un exemplu de dos variables de normal distribuyíes que sían incorreladas pero non independientes, vease de normal distribuyíes y incorreladas nun implica independencia.

Momentos más altos

El momentu estándar de k-ésimo orde de X defínese como

\mu _{1,\dots ,N}(X)\ {\stackrel {\mathrm {def} }{=}}\ \mu _{r_{1},\dots ,r_{N}}(X)\ {\stackrel {\mathrm {def} }{=}}\ Y\left[\prod \limits _{j=1}^{N}X_{j}^{r_{j}}\right]

onde $r_{1}+r_{2}+\cdots +r_{N}=k.$

Los momentos centrales d'orde k vien daos como sigue:

(a) Si k ye impar, $\mu _{1,\dots ,N}(X-\mu )=0$ .

(b) Si k ye par, con $k=2\lambda$ , entós

\mu _{1,\dots ,2\lambda }(X-\mu )=\sum \left(\sigma _{ij}\sigma _{k\ell }\cdots \sigma _{XZ}\right)

onde la suma toma sobre toles disposiciones de conxuntos $\left\{1,\dots ,2\lambda \right\}$ en $\lambda$ pareyes (non ordenar). Esto ye, si tiense un k-ésimo ( ${}=2\lambda =6$ ) momentu central, tarán sumándose los productos de $\lambda =3$ covarianzas (la notación - $\mu$ desprecióse pa facilitar la llectura):

{\begin{aligned}&{}Y[X_{1}X_{2}X_{3}X_{4}X_{5}X_{6}]\\&{}=Y[X_{1}X_{2}]Y[X_{3}X_{4}]Y[X_{5}X_{6}]+Y[X_{1}X_{2}]Y[X_{3}X_{5}]Y[X_{4}X_{6}]+Y[X_{1}X_{2}]Y[X_{3}X_{6}]Y[X_{4}X_{5}]\\&{}+Y[X_{1}X_{3}]Y[X_{2}X_{4}]Y[X_{5}X_{6}]+Y[X_{1}X_{3}]Y[X_{2}X_{5}]Y[X_{4}X_{6}]+Y[X_{1}X_{3}]Y[X_{2}X_{6}]Y[X_{4}X_{5}]\\&+Y[X_{1}X_{4}]Y[X_{2}X_{3}]Y[X_{5}X_{6}]+Y[X_{1}X_{4}]Y[X_{2}X_{5}]Y[X_{3}X_{6}]+Y[X_{1}X_{4}]Y[X_{2}X_{6}]Y[X_{3}X_{5}]\\&+Y[X_{1}X_{5}]Y[X_{2}X_{3}]Y[X_{4}X_{6}]+Y[X_{1}X_{5}]Y[X_{2}X_{4}]Y[X_{3}X_{6}]+Y[X_{1}X_{5}]Y[X_{2}X_{6}]Y[X_{3}X_{4}]\\&+Y[X_{1}X_{6}]Y[X_{2}X_{3}]Y[X_{4}X_{5}]+Y[X_{1}X_{6}]Y[X_{2}X_{4}]Y[X_{3}X_{5}]+Y[X_{1}X_{6}]Y[X_{2}X_{5}]Y[X_{3}X_{4}].\end{aligned}}

Esto da llugar a $(2\lambda -1)!/(2^{\lambda -1}(\lambda -1)!)$ términos na suma (15 nel casu de riba), caúnu siendo'l productu de $\lambda$ (3 nesti casu) covarianzas. Pa momentos de cuartu orde (cuatro variables) hai tres términos. Pa momentos de sestu orde hai 3 × 5 = 15 términos, y pa momentos d'octavu orde hai 3 × 5 × 7 = 105 términos.

Les covarianzas son entós determinaes por aciu el reemplazu de los términos de la llista $\left[1,\dots ,2\lambda \right]$ polos términos correspondientes de la llista que consiste en $r_{1}$ unos, entós $r_{2}$ doses, etc... Pa ilustrar esto, esamínese'l siguiente casu pel momento central de cuartu orde:

Y\left[X_{i}^{4}\right]=3\sigma _{ii}^{2}

Y\left[X_{i}^{3}X_{j}\right]=3\sigma _{ii}\sigma _{ij}

Y\left[X_{i}^{2}X_{j}^{2}\right]=\sigma _{ii}\sigma _{jj}+2\left(\sigma _{ij}\right)^{2}

Y\left[X_{i}^{2}X_{j}X_{k}\right]=\sigma _{ii}\sigma _{jk}+2\sigma _{ij}\sigma _{ik}

Y\left[X_{i}X_{j}X_{k}X_{n}\right]=\sigma _{ij}\sigma _{kn}+\sigma _{ik}\sigma _{jn}+\sigma _{in}\sigma _{jk}.

onde $\sigma _{ij}$ ye la covarianza de $X_{i}$ y $X_{j}$ . La idea del métodu de riba ye que primero s'atopa'l casu xeneral pal momentu $k$ -ésimo, onde se tien $k$ distintos variables $X$ - $Y\left[X_{i}X_{j}X_{k}X_{n}\right]$ y entós pueden simplificase apropiadamente. Si tiense $Y\left[X_{i}^{2}X_{k}X_{n}\right]$ entós, a cencielles seya $X_{i}=X_{j}$ y síguese que $\sigma _{ii}=\sigma _{i}^{2}$ .

Distribuciones condicionales

Si $\mu$ y $\Sigma$ son estremaes como sigue:

\mu ={\begin{bmatrix}\mu _{1}\\\mu _{2}\end{bmatrix}}\quad

con tamaños

{\begin{bmatrix}q\times 1\\(N-q)\times 1\end{bmatrix}}

\Sigma ={\begin{bmatrix}\Sigma _{11}&\Sigma _{12}\\\Sigma _{21}&\Sigma _{22}\end{bmatrix}}\quad

con tamaños

{\begin{bmatrix}q\times q&q\times (N-q)\\(N-q)\times q&(N-q)\times (N-q)\end{bmatrix}}

entós la distribución de $x_{1}$ condicionada a $x_{2}=a$ ye una normal multivariante $(X_{1}|X_{2}=a)\sim N({\bar {\mu }},{\overline {\Sigma }})$ onde

{\bar {\mu }}=\mu _{1}+\Sigma _{12}\Sigma _{22}^{-1}\left(a-\mu _{2}\right)

y matriz de covarianza

{\overline {\Sigma }}=\Sigma _{11}-\Sigma _{12}\Sigma _{22}^{-1}\Sigma _{21}.

Esta matriz ye'l complementu de Schur de ${\mathbf {\Sigma } _{22}}$ en ${\mathbf {\Sigma } }$ . Esto significa que pa calcular la matriz condicional de covarianza, inviértese la matriz global de covarianza, despréciense les files y columnes correspondientes a les variables so les cualos ta condicionada y entós inviértese de nuevu pa consiguir la matriz condicional de covarianza.

Nótese que se sabe que $x_{2}=a$ alteria la varianza, anque la nueva varianza nun dependa del valor específicu de $a$ ; quiciabes más sorprendentemente, la media camudar por $\Sigma _{12}\Sigma _{22}^{-1}\left(a-\mu _{2}\right)$ ; compárese esto cola situación na que nun se conoz el valor de $a$ , y nesi casu $x_{1}$ tendría como distribución

$N_{q}\left(\mu _{1},\Sigma _{11}\right)$ .

La matriz $\Sigma _{12}\Sigma _{22}^{-1}$ conozse como la matriz de coeficientes de regresión.

Esperanza condicional bivariante

Nel casu

${\begin{pmatrix}X_{1}\\X_{2}\end{pmatrix}}\sim {\mathcal {N}}\left({\begin{pmatrix}0\\0\end{pmatrix}},{\begin{pmatrix}1&\rho \\\rho &1\end{pmatrix}}\right)$

entós

$Y(X_{1}|X_{2}>z)=\rho {\phi (z) \over \Phi (-z)}$

onde esta última razón llámase de cutiu razón inversa de Mills.

Matriz d'información de Fisher

La matriz d'información de Fisher (MIF) pa una distribución normal toma una formulación especial. L'elementu $(m,n)$ de la MIF pa $X\sim N(\mu (\theta ),\Sigma (\theta ))$ ye

{\mathcal {I}}_{m,n}={\frac {\partial \mu }{\partial \theta _{m}}}\Sigma ^{-1}{\frac {\partial \mu ^{\top }}{\partial \theta _{n}}}+{\frac {1}{2}}\mathrm {tr} \left(\Sigma ^{-1}{\frac {\partial \Sigma }{\partial \theta _{m}}}\Sigma ^{-1}{\frac {\partial \Sigma }{\partial \theta _{n}}}\right)

onde * ${\frac {\partial \mu }{\partial \theta _{m}}}={\begin{bmatrix}{\frac {\partial \mu _{1}}{\partial \theta _{m}}}&{\frac {\partial \mu _{2}}{\partial \theta _{m}}}&\cdots &{\frac {\partial \mu _{N}}{\partial \theta _{m}}}&\end{bmatrix}}$

${\frac {\partial \mu ^{\top }}{\partial \theta _{m}}}=\left({\frac {\partial \mu }{\partial \theta _{m}}}\right)^{\top }={\begin{bmatrix}{\frac {\partial \mu _{1}}{\partial \theta _{m}}}\\\\{\frac {\partial \mu _{2}}{\partial \theta _{m}}}\\\\\vdots \\\\{\frac {\partial \mu _{N}}{\partial \theta _{m}}}\\\\\end{bmatrix}}$
${\frac {\partial \Sigma }{\partial \theta _{m}}}={\begin{bmatrix}{\frac {\partial \Sigma _{1,1}}{\partial \theta _{m}}}&{\frac {\partial \Sigma _{1,2}}{\partial \theta _{m}}}&\cdots &{\frac {\partial \Sigma _{1,N}}{\partial \theta _{m}}}\\\\{\frac {\partial \Sigma _{2,1}}{\partial \theta _{m}}}&{\frac {\partial \Sigma _{2,2}}{\partial \theta _{m}}}&\cdots &{\frac {\partial \Sigma _{2,N}}{\partial \theta _{m}}}\\\\\vdots &\vdots &\ddots &\vdots \\\\{\frac {\partial \Sigma _{N,1}}{\partial \theta _{m}}}&{\frac {\partial \Sigma _{N,2}}{\partial \theta _{m}}}&\cdots &{\frac {\partial \Sigma _{N,N}}{\partial \theta _{m}}}\end{bmatrix}}$
$\mathrm {tr}$ ye la función traza d'una matriz.

Diverxencia de Kullback-Leibler

La diverxencia de Kullback-Leibler de $N0_{N}(\mu _{0},\Sigma _{0})$ a $N1_{N}(\mu _{1},\Sigma _{1})$ ye:

D_{\text{KL}}(N0\|N1)={1 \over 2}\left(\log _{y}\left({\det \Sigma _{1} \over \det \Sigma _{0}}\right)+\mathrm {tr} \left(\Sigma _{1}^{-1}\Sigma _{0}\right)+\left(\mu _{1}-\mu _{0}\right)^{\top }\Sigma _{1}^{-1}(\mu _{1}-\mu _{0})-N\right).

El llogaritmu tien de tomase con base e nos dos términos (llogaritmos neperianos), siguiendo'l llogaritmu tán los llogaritmos neperianos de les espresiones que son dambos factores de la función de densidá o si non, surden naturalmente. La diverxencia de riba mídese en nats. Estremando la espresión de riba por log_y 2 dase pasu a la diverxencia en bits.

Estimación de parámetros

La derivación del estimador de máxima verosimilitud de la matriz de covarianza d'una distribución normal multivariante ye, quiciabes sorprendentemente, sutil y elegante. Vease estimación de matrices de covarianza.

En poques pallabres, la función de densidá de probabilidá d'una normal multivariante N-dimensional ye

f(x)=(2\pi )^{-N/2}\det(\Sigma )^{-1/2}\exp \left(-{1 \over 2}(x-\mu )^{T}\Sigma ^{-1}(x-\mu )\right)

y el estimador MV de la matriz de covarianza pa una muestra de n observaciones ye

{\widehat {\Sigma }}={1 \over n}\sum _{i=1}^{n}(X_{i}-{\overline {X}})(X_{i}-{\overline {X}})^{T}

lo cual ye, a cencielles, la matriz muestral de covarianza. Este ye un estimador sesgado que la so esperanza ye

Y[{\widehat {\Sigma }}]={n-1 \over n}\Sigma .

Una covarianza muestral insesgada ye

{\widehat {\Sigma }}={1 \over n-1}\sum _{i=1}^{n}(X_{i}-{\overline {X}})(X_{i}-{\overline {X}})^{T}.

Entropía

La entropía diferencial de la distribución normal multivariante ye^[4]

{\begin{aligned}h\left(f\right)&=-\int _{-\infty }^{\infty }\int _{-\infty }^{\infty }\cdots \int _{-\infty }^{\infty }f(x)\ln f(x)\,dx\\&={\frac {1}{2}}\left(N+N\ln \left(2\pi \right)+\ln \left|\Sigma \right|\right)\\&={\frac {1}{2}}\ln\{(2\pi y)^{N}\left|\Sigma \right|\}\end{aligned}}

onde $\left|\Sigma \right|$ ye'l determinante de la matriz de covarianza $\Sigma$ .

Tests de normalidá multivariante

Los tests de normalidá multivariante comprueben la semeyanza d'un conxuntu dau de datos cola distribución normal multivariante. La hipótesis nula ye que'l conxuntu de datos ye similar a la distribución normal, por consiguiente un p-valor abondo pequeñu indica datos non normales. Los tests de normalidá multivariante inclúin el test de Cox-Small^[5] y l'adaptación de Smith y Jain ^[6] del test de Friedman-Rafsky.

Asemeyando valores de la distribución

Un métodu llargamente usáu p'asemeyar un vector aleatoriu $X$ de la distribución normal multivariada $N$ -dimensional con vector de medies $\mu$ y matriz de covarianza $\Sigma$ (riquida pa ser simétrica y definida positiva) funciona como sigue:

Calcúlase la descomposición de Cholesky de $\Sigma$ , esto ye, atópase la única matriz triangular inferior $A$ tal que $A\,A^{T}=\Sigma$ . Nótese que cualesquier otra matriz $A$ que satisfaiga esta condición, esto ye, que ye unu la raigañu cuadráu de $\Sigma$ , podría usase, pero de cutiu atopar tal matriz, distinta de la de la descomposición de Cholesky, sería abondo más costosu en términos de computación.
Sía $Z=(z_{1},\dots ,z_{N})^{T}$ un vector que les sos componentes $N$ normales ya independientes varien (lo cual puede xenerase, por casu, usando'l métodu de Box-Muller.
Sía $X=\,$ $\mu +AZ\,.$

Referencies

↑ Vease MVNDST en [1] Archiváu 2008-04-15 en Wayback Machine (incluyi códigu FORTRAN) o [2] (inclúi códigu MATLAB).
↑ Ver tamién de normal distribuyíes y incorreladas nun implica independencia
↑ Nikolaus Hansen. «The CMA Evolution Strategy: A Tutorial». Archiváu dende l'orixinal, el 2010-03-31.
↑ Gokhale, DV; NA Ahmed, BC Res, NJ Piscataway (mayu de 1989). «Entropy Expressions and Their Estimators for Multivariate Distributions». Information Theory, IEEE Transactions on 35 (3): páxs. 688–692. doi:10.1109/18.30996.
↑ Cox, D. R.; N. J. H. Small (agostu de 1978). «Testing multivariate normality». Biometrika 65 (2): páxs. 263–272. doi:10.1093/biomet/65.2.263.
↑ Smith, Stephen P.; Anil K. Jain (setiembre de 1988). «A test to determine the multivariate normality of a dataset». IEEE Transactions on Pattern Analysis and Machine Intelligence 10 (5): páxs. 757–761. doi:10.1109/34.6789.

[1] Vease MVNDST en [1] Archiváu 2008-04-15 en Wayback Machine (incluyi códigu FORTRAN) o [2] (inclúi códigu MATLAB).

[2] Ver tamién de normal distribuyíes y incorreladas nun implica independencia

[3] Nikolaus Hansen. «The CMA Evolution Strategy: A Tutorial». Archiváu dende l'orixinal, el 2010-03-31.

[4] Gokhale, DV; NA Ahmed, BC Res, NJ Piscataway (mayu de 1989). «Entropy Expressions and Their Estimators for Multivariate Distributions». Information Theory, IEEE Transactions on 35 (3): páxs. 688–692. doi:10.1109/18.30996.

[5] Cox, D. R.; N. J. H. Small (agostu de 1978). «Testing multivariate normality». Biometrika 65 (2): páxs. 263–272. doi:10.1093/biomet/65.2.263.

[6] Smith, Stephen P.; Anil K. Jain (setiembre de 1988). «A test to determine the multivariate normality of a dataset». IEEE Transactions on Pattern Analysis and Machine Intelligence 10 (5): páxs. 757–761. doi:10.1109/34.6789.

[1]

[2]

[3]

[4]

[5]

[6]

Distribución normal multivariante
Parámetros	$\mu =[\mu _{1},\dots ,\mu _{n}]^{T}$ (vector real) $\Sigma$ matriz de covarianza (matriz real definida positiva de dimensión $n\times n$ )
Función de densidá (pdf)	$f_{X}(x_{1},\dots ,x_{n})={\frac {1}{(2\pi )^{n/2}\left\|\Sigma \right\|^{1/2}}}$ $\exp \left(-{\frac {1}{2}}(x-\mu )^{\top }\Sigma ^{-1}(x-\mu )\right)$
Función de distribución (cdf)	Ensin espresión analítica
Media	$\mu \,\!$
Mediana	$\mu \,\!$
Moda	$\mu \,\!$
Varianza	$\sigma ^{2}\,\!$
Coeficiente de simetría	0
Curtosis	0
Entropía	$\ln \left({\sqrt {(2\,\pi \,y)^{n}\left\|\Sigma \right\|}}\right)\!$
Función xeneradora de momentos (mgf)	$M_{X}(t)=\exp \left(\mu ^{\top }t+{\frac {1}{2}}t^{\top }\Sigma t\right)$
Función característica	$\phi _{X}(t;\mu ,\Sigma )=\exp \left(i\mu ^{\top }t-{\frac {1}{2}}t^{\top }\Sigma t\right)$
[editar datos en Wikidata]