层次贝叶斯模型(一) 之 构建参数化的先验分布
这个系列的博客来自于 Bayesian Data Analysis, Third Edition. By. Andrew Gelman. etl. 的翻译 翻译属于原创,转载请注明来源。谢谢。
很多统计模型都有多个参数,这些参数也可以通过某种方式变成具有结构的问题,意味着这些参数的联合概率模型应当反应出它们之间的依赖关系。举个例子说,在研究心脏病治疗效果的时候,医院 j 的病人的存活率为θ,那么我们估计θ应当是相互联系的。我们可以看到使用先验分布,把θ当作一个总体分布的样本是很自然的事情。这样的应用有一个很关键的点是,观测数据,y,其中 i 表示组的索引,j 表示单元的索引,可以用来估计θ的总体分布,即便θ并不是观测的。这样的问题使用层次模型是很自然的事情,其中观测的结果是在某些参数下的条件模型,这些参数称为超参数。这样的层次模型可以帮助我们理解多参数问题,并且在寻找计算策略时提供重要帮助。 实际中,简单的非层次模型可能并不适合层次数据:在很少的参数情况下,它们并不能准确适配大规模数据集,然而,过多的参数则可能导致过拟合的问题。相反,层次模型有足够的参数来拟合数据,同时使用总体分布将参数的依赖结构化,从而避免过拟合问题。 在本章节中,Section1,我们考虑使用层次准则构建先验分布,但不构建一个正式的具有层次结构的概率模型。我们首先考虑分析单组实验,使用历史数据构造先验分布,然后考虑对一组实验的参数构建一个灵活的先验分布。Section1中的实验并不完全是贝叶斯,为了便于阐述,我们只做点估计,不考虑完整的联合后验分布。在Section2中,我们讨论如何在完全的贝叶斯分析情境下构造层次先验分布。Section3-4通过联合分析的和数值的方法,利用共轭分布族,描述层次模型的一般性计算方法。这里将说明两个扩展的案例:一个教育实验的层次模型和一个医疗研究。我们将使用这两个案例说明一些研究中共同的问题。我们将说明弱信息先验在构造适合分组较小的数据中的层次模型的重要性。

