最新AI大模型咨询与技术解读——来自DataLearnerAI

★ 【置顶】推荐一个国内可以按分钟计费的4090显卡租用公有云，一个小时24GB显存的4090只需要2.37元——仙宫云

大模型的发展速度很快，对于需要学习部署使用大模型的人来说，显卡是一个必不可少的资源。使用公有云租用显卡对于初学者和技术验证来说成本很划算。DataLearnerAI在此推荐一个国内的合法的按分钟计费的4090显卡公有云服务提供商仙宫云，可以按分钟租用24GB显存的4090显卡公有云实例，非常具有吸引力~

4090显卡/仙宫云/显卡公有云/显卡租赁

检索增强生成（RAG）

大模型检索增强生成是一种结合了大规模语言模型的自动生成能力和针对特定数据的检索机制，以提供更准确、信息丰富的输出内容的技术。

查看RAG合集

Long Context

大模型对长上下文的处理能力在于它们能够理解和维持较长篇幅的文本连贯性，有助于提升质量，以及对复杂问题和讨论的理解和回应质量。

LongContext合集

AI Agent

大模型的AI Agent是一种高级智能系统，能够理解复杂的指令和查询，并以人类般的方式生成响应、执行任务或提供决策支持。

AI Agent合集

层次狄利克雷过程（Hierarchical Dirichlet Processes）

Dirichlet过程是一种重要的非参数模型，它可运用在聚类中，自动发现类别的数量。但很多时候，我们的工作都是具有层次话的。这篇文章介绍的层次狄利克雷模型就是解决这样的问题的。

2017/02/27 10:24:53

17681

#DPMM##HDP##统计#

Dirichlet Tree Distribution（狄利克雷树分布）

狄利克雷分布作为多项式分布的先验大家应该比较熟悉了。这里介绍另外一种Dirichlet树结构的分布，也可以作为多项式分布的先验，但却更加灵活

2017/02/06 21:17:00

5540

#Dirichlet##分布##统计基础#

EM算法简介及其例子

EM（expectation-maximization）算法是统计学中求统计模型的最大似然和最大后验参数估计的一种迭代式算法，模型一般是依赖于不可观测的潜在变量。

2017/02/06 21:16:28

10739

#EM##参数估计##统计推断#

多元高斯分布（多元正态分布）简介

高斯分布是一种非常常见的分布，对于一元高斯分布我们比较熟悉，对于高斯分布的多元形式有很多人不太理解。这篇博客的材料主要来源Andrew Ng在斯坦福机器学习课的材料。

2017-01-28 23:02:43

36279

#正态分布##统计基础##高斯分布#

机器学习中MCMC方法介绍

有人把Metropolis算法当作是二十世纪最伟大的十大算法之一。这个算法是大规模抽样算法的一种，也叫做马尔可夫链蒙特卡洛（Markov chain Monte Carlo，MCMC）。对于很多高维问题来说，比如计算一个凸体的体积，MCMC仿真是目前唯一可以在合理时间内解决这个问题的一般性方法。本文介绍了三种主流的MCMC算法，即MH算法、模拟退火算法和吉布斯抽样方法

2016-12-28 20:19:29

9150

#GibbsSampling##MCMC##MH##模拟退火算法#

贝叶斯统计中的计算方法简介

仿真抽样是给予贝叶斯方法第二春的重要角色。由于很多时候实际问题很复杂，我们无法精确求出后验密度，使用仿真抽样的方法我们可以获得近似的结果。这篇博客主要介绍了几种仿真抽样的方法。

2016-12-28 20:05:21

6555

#MCMC##仿真##抽样方法##极大似然估计##极大后验估计##贝叶斯统计#

Eclipse打包Java工程并导出jar包

使用eclipse打包java工程并导出java包

2016-12-12 20:48:12

3358

#程序#

狄利克雷过程混合模型（Dirichlet Process Mixture Model, DPMM）

狄利克雷过程混合模型（Dirichlet Process Mixture Model, DPMM）是一种非参数贝叶斯模型，它可以理解为一种聚类方法，但是不需要指定类别数量，它可以从数据中推断簇的数量。这篇博客将描述该模型及其求解过程。

2016-08-19 18:04:56

22704

#dirichletprocessmixturemodel##dpmm##混合模型##非参数贝叶斯#

参数估计之极大似然估计、极大后验估计和贝叶斯参数估计

这篇博客主要翻译自Gregor Heinrich的技术博客Parameter estimation for text analysis，介绍极大似然估计、极大后验估计和贝叶斯参数估计的原理和案例

2016-05-17 16:27:13

3332

#参数估计##极大似然估计##极大后验估计##贝叶斯参数估计#

贝叶斯分析推断的一些基础知识

贝叶斯分析在概率模型中有非常重要的作用，这些年以来比较有影响力的模型如LDA、非参数贝叶斯模型等都是基于贝叶斯分析的。贝叶斯分析有一些非常基础性的知识，在这里我们描述了贝叶斯分析里面的一些基本表示和一些分析准则等内容。

2016-04-08 10:00:14

7515

#基础知识##概率##贝叶斯分析#

层次贝叶斯模型（一）之构建参数化的先验分布

这个系列的博客来自于 Bayesian Data Analysis, Third Edition. By. Andrew Gelman. etl. 的第五章的翻译。实际中，简单的非层次模型可能并不适合层次数据：在很少的参数情况下，它们并不能准确适配大规模数据集，然而，过多的参数则可能导致过拟合的问题。相反，层次模型有足够的参数来拟合数据，同时使用总体分布将参数的依赖结构化，从而避免过拟合问题。

2016-04-07 08:19:13

18878

#层次模型##统计推断##贝叶斯模型#

机器学习中的高斯过程

关于高斯过程，其实网上已经有很多中文博客的介绍了。但是很多中文博客排版实在是太难看了，而且很多内容介绍也不太全面，搞得有点云里雾里的。因此，我想自己发表一个相关的内容，大多数内容来自于英文维基百科和几篇文章。

2016-04-07 08:14:01

21090

#机器学习##统计##非参数模型##高斯过程#

我们对层次贝叶斯推断的策略与一般的多参数问题一样，但由于在实际中层次模型的参数很多，所以比较困难。在实际中，我们很难画出联合后验概率分布的图形。但是，我们可以使用近似的基于仿真的方法。在这个部分，我们提出一个联合了分析的和数值的方法从联合后验分布p(θ, φ|y)中获取仿真结果，以小鼠肿瘤实验的beta-binormial模型为例，总体分布是p(θ|φ)，与似然函数p(y|θ)是共轭的。对于很多非共轭层次模型，更高级的算法将在后面叙述。即使针对更复杂的问题，使用共轭分布来获取近似估计也是很有用的。

2016-04-03 17:15:48

8151

#层次模型##统计推断##贝叶斯#