多元正态(高斯)分布的贝叶斯推导(Bayesian Inference for the Multivariate Normal)

标签:#多元正态分布##统计# 时间:2017/11/04 09:29:37 作者:小木

多元正态分布分布的贝叶斯推导是一种常见的贝叶斯推导的实例,一般来说,对于均值和方差位置的多元正态分布,我们使用Normal-Wishart先验来推导其后验分布。

一、简介

我们在这里先简单介绍一下问题的背景。假设我们有一组观测数据,每一个观测数据都是一个向量,他们都是来自于某一个多元正态分布,也就说,他们都是服从均值为\mu协方差是\Sigma的多元正态分布。我们的目标就是利用这些样本数据,估计这个\mu\Sigma的值。

假设我们有n个样本,是来自于某个多元正态分布的样本,其维度是p,即X_i \sim N(\mu,\Sigma),那么这里的协方差矩阵\Sigma是一个p \times p的矩阵。那么,这些样本的似然函数是:

\begin{aligned} L(\mu,\Sigma,X) &= \prod_{i=1}^{n} \frac{1}{\sqrt{(2\pi)^d|\Sigma|}} \exp ( (-1/2)(X_i-\mu)'\Sigma^{-1}(X_i-\mu) ) \\ &\\ &= \frac{1}{(2\pi)^{nd/2}|\Sigma|^{n/2}} \exp ( -(1/2)\sum_{i=1}^n(X_i-\mu)'\Sigma^{-1}(X_i-\mu) ) \\ \end{aligned}

公式1

这里的求和结果可以写成(这里其实乍看确实很奇怪,大家可以使用3乘以3的例子算一下确实是这个结果):

\begin{aligned} \sum_{i=1}^n(X_i-\mu)'\Sigma^{-1}(X_i-\mu) &= \sum_{i=1}^n \sum_{a=1}^p\sum_{b=1}^p (X_{ia}-\mu_a)(\Sigma^{-1})(X_{ib}-\mu_b) \\ &\\ &= \sum_{a=1}^n\sum_{b=1}^n(\Sigma^{-1})_{ab}\Sigma_{i=1}^n (X_{ia}-\mu_a)(X_{ib}-\mu_b) \\ &\\ &= \sum_{a=1}^n\sum_{b=1}^n (\Sigma^{-1}) Q(\mu)_{ab} = \text{tr}(\Sigma^{-1}Q(\mu)) \end{aligned}

其中:

\begin{aligned} Q(\mu) &= \sum_{i=1}^n(X_i-\mu)(X_i-\mu)' \\ &\\ &=\sum_{i=1}^n(X_i-\bar{X})(X_i-\bar{X})' + n(\bar{X}-\mu)(\bar{X}-\mu)' \end{aligned}

欢迎大家关注DataLearner官方微信,接受最新的AI技术推送