Wishart分布简介

标签:#Wishart分布##分布##多元正态分布##统计##高斯分布# 时间:2017/11/04 09:29:46 作者:小木

首先我们介绍为什么要用Wishart分布。假设我们有从一元正态分布中抽取的n个独立的样本。那么这些样本的方差应该是服从一个自由度是n-1\chi^2分布(具体介绍请参考如何抽取样本方差的分布)。Wishart分布是\chi^2分布在多元上的推广。因此,它可以用来描述多元正态分布样本的协方差矩阵。它在多元正态分布分布的贝叶斯推导中非常重要。

Wishart分布是根据John Wishart来的,他第一次提出了这个分布。Wishart分布是一组定义在对称、非负定矩阵的随机变量(随机矩阵)。这些分布在估计多元统计中的协方差的时候很有用。

定义

假设X是一个n\times p的矩阵,每一行都是从均值为0的p维正态分布中抽取的独立样本,即:

X_{(i)} = (x_i^1,\cdots,x_i^p) \sim N_p(\textbf{0},\Sigma)

那么,Wishart分布S就是这个这个p\times p的随机矩阵的概率分布:

S = \sum_{i=1}^nX_i^TX_i

它通常被称为散度矩阵,写法如下:

S \sim W_p(\Sigma,n)

这里的n是自由度。有时候也写成W(\Sigma,p,n),那么对于n \geq p的矩阵S,如果\Sigma是可逆的,那么它也是可逆的。当p=\Sigma=1那么这个分布是一个自由度为n\chi^2分布。同时,当协方差是单位矩阵的时候,也称之为标准Wishart分布。

另一种描述。

Wishart分布是用来为随机协方差矩阵建模的。它是定义如下:

S \sim W(\Sigma,p,n) = \sum_{i=1}^n X_i X'_i

X_i \sim N(0,\Sigma)

因此,Wishart分布是一组一阶矩阵的和的分布,这些一阶矩阵相互独立,都是来自于均值为0,协方差矩阵是\Sigma的样本。且:

E(S) = nE(X'X)=nCov(X_i)=n\Sigma

更一般的,当任意X\sim N(\mu,\Sigma)时候,有:

X = \mu + AZ, Z\sim N(0,I_d)

那么:

\Sigma = Cov(X) = A Cov(Z)A' = AA'

这里寻找A最简单的方法是使用LU-Decomposition。它可以找出一个唯一的低阶对角阵A,使得:

AA' = \Sigma

然后,再通过上面的式子的结合,我们得到:

\begin{aligned} S(\Sigma,p,n) &=\sum_{i=1}^n(AZ_i)(AZ_i)' \\ &\\ &= A(\sum_{i=1}^nZ_iZ'_i)A'\\ &\\ &=AW(I_p,p,n)A' \end{aligned}

也就是说,对于均值不为0的多元高斯分布,我们也可以通过上述转换转换成标准Wishart分布。

概率密度函数

Wishart分布S的概率密度函数如下:

f(S)= \frac{1}{2^{np/2}\Gamma_p(\frac{n}{2})|\Sigma|^{n/2}} |S|^{(n-p-1)/2} \exp [ -\frac{1}{2} \text{trace}(\Sigma^{-1}S)]

这里的\Gamma_p(\frac{n}{2})是一个多元的Gamma函数,\text{trace}(\Sigma^{-1}S)是矩阵的迹(方阵上主对角线上元素的和)。但是实际上,这个概率密度的具体形式很少用到。但是它有很大的作用:

  1. Wishart分布经常作为正态分布的协方差矩阵的逆的共轭先验分布(它最大的作用是用来描述正态分布样本的协方差矩阵,这点和chi-square分布描述一元正态分布样本的方差是一样的意思)。
  2. 当一个对称的正定矩阵是扩散张量研究正所感兴趣的随机元素的时候,这个分布也很重要。

Wishart分布的命题

1、如果有M\sim W_p(n,\Sigma)\text{且}B_{p * m},那么,

B'MB \sim W_m(n,B'\Sigma,B)

2、如果有M \sim W_p(n,\Sigma)\Sigma>0,那么,\Sigma^{-\frac{1}{2}}M\Sigma^{\frac{1}{2}} \sim W_p(n,I_p)
3、如果有M_i \sim W_p(n_i,\Sigma), (i=1,\cdots,k),那么,\sum_{i=1}^k M_{i} \sim W_p(n,\Sigma),这里的n=n_1+\cdots+n_k
4、如果有M \sim W_p(n,\Sigma),那么,EM = n\Sigma
5、如果有两个相互独立的随机变量M_1M_2,且M_1 + M_2 = M \sim W_p(n,\Sigma)M_1\sim W_p(n_1,\Sigma),那么有M_2\sim W_p(n-n_1,\Sigma)

Wishart分布最重要的作用

Wishart分布最重要的作用是描述多元正态分布样本的协方差。即假设X_1,\cdots,X_n是独立同分布的样本,它们都是来自N_p(\mu,\Sigma)p维的)。那么,样本的均值和方差分别是:

\bar{X} = \frac{1}{n} \sum_{i=1}^n X_i

S = \frac{1}{n-1} \sum_{i=1}^n (X_i-\bar{X})(X_i-\bar{X})'

并且有
1、\bar{X}S是相互独立的。且

\sqrt{n} (\bar{x}-\mu) \sim N_p (0,\Sigma)

(n-1)S \sim W_p (n-1,\Sigma)

参考1:http://www.stat.pitt.edu/sungkyu/course/2221Fall13/lec2.pdf
参考2:http://www.math.wustl.edu/~sawyer/hmhandouts/Wishart.pdf
参考3:http://www.fil.ion.ucl.ac.uk/~wpenny/publications/bmn.pdf
参考4:https://www.statlect.com/probability-distributions/wishart-distribution

欢迎大家关注DataLearner官方微信,接受最新的AI技术推送