用户 小木 的博客
MySQL启用中文全文检索功能

MySQL支持对文本进行全文检索,全文检索可以类似搜索引擎的功能,相比较模糊匹配更加灵活高效且更快。MySQL5.7之后也支持对中文的全文检索,这里描述如何启用MySQL的中文全文检索。

小木 53 2018/05/09 08:53:54 #MySQL##全文检索#
Git的简介和使用

Git是一个版本控制系统,用来追踪计算机文件的变化的工具,也是一个供多人使用的协同工具。它是一个分布式的版本控制系统,本文将简单介绍如何使用。

小木 222 2018/04/05 09:51:36 #协作##编程#
如何理解狄利克雷过程(Dirichlet Process)

狄利克雷过程是非参贝叶斯推断的基础模型。本博客将简要介绍狄利克雷过程模型

小木 734 2018/01/04 20:10:37 #DirichletProcess##狄利克雷过程##非参贝叶斯#
多项式分布的贝叶斯推断

多项式分布是非常常见的分布,他是二项分布在多维上的推广。例如掷骰子结果中,1-6点出现的次数就是一个多项式分布。多项式分布在如主题建模中非常常见,本文将讲述多项式分布的贝叶斯推导过程。

小木 338 2017/12/01 22:28:46 #分布##多项式分布##统计基础##贝叶斯#
高斯混合模型(GMM)

高斯混合模型是一个参数概率密度函数,它是一组高斯密度函数的加权求和。在生物统计领域,高斯混合模型通常是连续测度或者特征的概率分布的参数模型。高斯混合模型可以使用迭代的EM算法或者最大后验概率法估计参数。

小木 1106 2017/11/30 15:57:04 #混合模型##统计##高斯混合模型#
文本预处理的一般步骤和方法

文本预处理是一件极其耗费时间的事情,不仅繁琐而且涉及的细节很多,处理不好对后面的事情的影响很大。本文将简要介绍文本预处理的一般步骤和方法。

小木 818 2017/11/29 09:58:51 #文本处理##文本挖掘##预处理#
常见的正则表达式写法总结

正则表达式非常有用,非常强大,但也并不容易写,在这里我们总结一些常用的正则表达式写法

小木 412 2017/11/18 09:20:50 #java##正则表达式#
Dirichlet Distribution(狄利克雷分布)与Dirichlet Process(狄利克雷过程)

Dirichlet过程是一个随机过程,在非参数贝叶斯模型中有广泛运用,最常见的应用是Dirichlet过程混合模型

小木 44856 2017/11/14 15:06:41 #Dirichlet分布##Dirichlet过程##无限混合模型##混合模型##贝叶斯模型#
Eclipse使用Maven插件的简单介绍

使用Maven作为构建工具,管理项目和依赖非常方便。这篇博客将简要介绍在Eclipse中如何使用Maven插件

小木 444 2017/11/08 15:25:09 #maven##构建工具##编程#
Java爬虫入门简介(一) —— HttpClient请求

使用爬虫获取数据对科研来说及其重要,本系列博客将讲述如何使用Java编写爬虫工具获取网页数据。包括HttpClient 4.3及以上版本的Header设置,请求参数设置等。

小木 925 2017/11/08 15:24:56 #HttpClient##Java##爬虫#
Java爬虫入门简介(三) —— Jsoup解析HTML页面

使用爬虫获取数据对科研来说及其重要,本系列博客将讲述如何使用Java编写爬虫工具获取网页数据。在这篇博客里,我们将简单介绍Jsoup解析HTML页面的操作。

小木 589 2017/11/08 11:16:51 #HttpClient##Java##Jsoup##爬虫#
Java爬虫入门简介(二) —— HttpClient详细使用方法

使用爬虫获取数据对科研来说及其重要,本系列博客将讲述如何使用Java编写爬虫工具获取网页数据。包括HttpClient 4.3及以上版本的Header设置,请求参数设置等。

小木 468 2017/11/08 11:16:43 #HttpClient##爬虫#
Android开发入门基础

Android是基于Linux的修改版本的移动操作系统。 大多数Android代码是在开源Apache许可证下发布的。本文将简单介绍Android开发入门知识。

小木 425 2017/11/08 11:16:37 #Android##移动编程##编程#