统计、机器学习与编程知识的原创博客
如何理解狄利克雷过程(Dirichlet Process)

狄利克雷过程是非参贝叶斯推断的基础模型。本博客将简要介绍狄利克雷过程模型

小木 739 2018/01/04 20:10:37 DirichletProcess/狄利克雷过程/非参贝叶斯
多项式分布的贝叶斯推断

多项式分布是非常常见的分布,他是二项分布在多维上的推广。例如掷骰子结果中,1-6点出现的次数就是一个多项式分布。多项式分布在如主题建模中非常常见,本文将讲述多项式分布的贝叶斯推导过程。

小木 340 2017/12/01 22:28:46 分布/多项式分布/统计基础/贝叶斯
高斯混合模型(GMM)

高斯混合模型是一个参数概率密度函数,它是一组高斯密度函数的加权求和。在生物统计领域,高斯混合模型通常是连续测度或者特征的概率分布的参数模型。高斯混合模型可以使用迭代的EM算法或者最大后验概率法估计参数。

小木 1133 2017/11/30 15:57:04 混合模型/统计/高斯混合模型
文本预处理的一般步骤和方法

文本预处理是一件极其耗费时间的事情,不仅繁琐而且涉及的细节很多,处理不好对后面的事情的影响很大。本文将简要介绍文本预处理的一般步骤和方法。

小木 828 2017/11/29 09:58:51 文本处理/文本挖掘/预处理
常见的正则表达式写法总结

正则表达式非常有用,非常强大,但也并不容易写,在这里我们总结一些常用的正则表达式写法

小木 414 2017/11/18 09:20:50 java/正则表达式
origin绘图操作案例(1)

日常绘图时,会使用都origin,其是一款非常强大的制图工具

十七岁的雨季 359 2017/11/17 10:47:56 origin/论文制图
Dirichlet Distribution(狄利克雷分布)与Dirichlet Process(狄利克雷过程)

Dirichlet过程是一个随机过程,在非参数贝叶斯模型中有广泛运用,最常见的应用是Dirichlet过程混合模型

小木 44897 2017/11/14 15:06:41 Dirichlet分布/Dirichlet过程/无限混合模型/混合模型/贝叶斯模型
用stata做倾向值分析和匹配

倾向值分析;stata; propensity score matching using stata

慕清雪 386 2017/11/13 21:45:35 备忘程序
Eclipse使用Maven插件的简单介绍

使用Maven作为构建工具,管理项目和依赖非常方便。这篇博客将简要介绍在Eclipse中如何使用Maven插件

小木 445 2017/11/08 15:25:09 maven/构建工具/编程
Java爬虫入门简介(一) —— HttpClient请求

使用爬虫获取数据对科研来说及其重要,本系列博客将讲述如何使用Java编写爬虫工具获取网页数据。包括HttpClient 4.3及以上版本的Header设置,请求参数设置等。

小木 932 2017/11/08 15:24:56 HttpClient/Java/爬虫
Java爬虫入门简介(三) —— Jsoup解析HTML页面

使用爬虫获取数据对科研来说及其重要,本系列博客将讲述如何使用Java编写爬虫工具获取网页数据。在这篇博客里,我们将简单介绍Jsoup解析HTML页面的操作。

小木 590 2017/11/08 11:16:51 HttpClient/Java/Jsoup/爬虫