人工智能与大模型最新资讯与技术博客 | 数据学习(Datalearner)

★ 【置顶】推荐一个国内可以按分钟计费的4090显卡租用公有云，一个小时24GB显存的4090只需要2.37元——仙宫云

大模型的发展速度很快，对于需要学习部署使用大模型的人来说，显卡是一个必不可少的资源。使用公有云租用显卡对于初学者和技术验证来说成本很划算。DataLearnerAI在此推荐一个国内的合法的按分钟计费的4090显卡公有云服务提供商仙宫云，可以按分钟租用24GB显存的4090显卡公有云实例，非常具有吸引力~

4090显卡/仙宫云/显卡公有云/显卡租赁

Card image cap

检索增强生成（RAG）

大模型检索增强生成是一种结合了大规模语言模型的自动生成能力和针对特定数据的检索机制，以提供更准确、信息丰富的输出内容的技术。

查看RAG合集

Card image cap

Long Context

大模型对长上下文的处理能力在于它们能够理解和维持较长篇幅的文本连贯性，有助于提升质量，以及对复杂问题和讨论的理解和回应质量。

LongContext合集

Card image cap

AI Agent

大模型的AI Agent是一种高级智能系统，能够理解复杂的指令和查询，并以人类般的方式生成响应、执行任务或提供决策支持。

AI Agent合集

Android开发中常见错误及其解决方法

Android开发中常见错误及其解决方法

在Android开发中，我们经常会遇到很多问题，这里记录了一些常见的问题及其解决方法

2017/11/08 11:15:32

6176

Android/移动编程/编程/错误记录

SCI/SCIE/SSCI/期刊查询验证方法

SCI/SCIE/SSCI/期刊查询验证方法

本文简要介绍了SCI/SCI-E/SSCI的区别以及相关期刊验证查询方法

2017/11/08 11:15:19

20020

SCI/SCIE/SSCI/学术/科研

帮助你提升知识和技能的17个数据科学项目（都是可以免费获取的）

帮助你提升知识和技能的17个数据科学项目（都是可以免费获取的）

数据科学项目为我们提供了很好的机会提升我们的技能和知识。这篇博客提供了17个数据科学的项目，都是可以免费获取的项目，大家可以通过这些诶项目学习数据科学相关知识。

2017/11/07 16:33:37

2909

数据/数据学习/数据科学

正则项的理解之正则从哪里来

在机器学习或者深度学习中，正则项是我们经常遇到的概念。它对提高模型的准确性和泛化能力非常重要。本文详细描述了正则项的来源以及与其他概念的相关关系。

2017/11/06 17:02:19

14116

人工智能/机器学习/正则化/正则项/深度学习

【转载】全面解读ICML 2017五大研究热点 | 腾讯AI Lab独家解析

【转载】全面解读ICML 2017五大研究热点 | 腾讯AI Lab独家解析

腾讯AI Lab去年四月成立，今年是首次参加ICML，共计四篇文章被录取，位居国内企业前列。此次团队由机器学习和大数据领域的专家、腾讯AI Lab主任张潼博士带领到场交流学习，张潼博士还担任了本届ICML领域主席。在本次130人的主席团队中，华人不超过10位，内地仅有腾讯AI Lab、清华大学和微软研究院三家机构。

2017/11/04 09:36:19

2710

学术/科研/顶级会议

推荐系统之概率矩阵分解的详细推导过程（Probabilistic Matrix Factorization，PMF）

推荐系统之概率矩阵分解的详细推导过程（Probabilistic Matrix Factorization，PMF）

本篇博客详细说明了概率矩阵分解（Probabilistic Matrix Factorization，PMF）的推导过程

2017/11/04 09:36:06

14721

PMF/推荐/概率矩阵分解/矩阵分解

【转载】变分贝叶斯算法理解与推导

【转载】变分贝叶斯算法理解与推导

变分贝叶斯是一类用于贝叶斯估计和机器学习领域中近似计算复杂（intractable）积分的技术。它主要应用于复杂的统计模型中，这种模型一般包括三类变量：观测变量(observed variables, data)，未知参数（parameters）和潜变量（latent variables）。

2017/11/04 09:34:53

6775

变分推断/统计

Wishart分布简介

Wishart分布在多元高斯的贝叶斯推断中非常重要。它通常作为正态分布的协方差矩阵的逆矩阵的共轭先验存在。这篇博客将详细讲述Wishart分布及其作用。

2017/11/04 09:29:46

39414

Wishart分布/分布/多元正态分布/统计/高斯分布

多元正态（高斯）分布的贝叶斯推导（Bayesian Inference for the Multivariate Normal）

多元正态（高斯）分布的贝叶斯推导（Bayesian Inference for the Multivariate Normal）

多元正态（高斯）分布分布是我们最常用的分布之一，这篇博客的主要内容来自Will Penny的文章的翻译。主要讲述关于多元正态分布的贝叶斯推导

2017/11/04 09:29:37

12246

多元正态分布/统计

深度学习基础——激活函数以及什么时候该使用激活函数

深度学习基础——激活函数以及什么时候该使用激活函数

这篇博客是来自Analytics Vidhya的一篇文章。写的很不错。

2017/11/04 09:29:27

20684

深度学习/激活函数

Java爬虫入门简介（五）——抓包工具的使用以及使用HttpClient模拟用户登录的访问

Java爬虫入门简介（五）——抓包工具的使用以及使用HttpClient模拟用户登录的访问

网络爬虫需要解决的一个重要的问题就是要针对某些需要用户名和密码访问的页面可以模拟用户自动登录。在这一篇博客中我们将介绍如何使用Chrome浏览器自带的抓包工具分析页面并模拟用户自动登录

2017/11/04 09:28:53

7211

HttpClient/Java/爬虫

自然语言处理中常见的10个任务简介及其资源

自然语言处理中常见的10个任务简介及其资源

这篇博客主要介绍了文本预处理的一般步骤以及常见的自然语言处理任务简介。

2017/11/04 09:28:43

12089

NLP/文本处理/自然语言处理

分解机（Factorization Machine, FM）模型简介以及如何使用SGD、ALS和MCMC求解分解机

分解机（Factorization Machine, FM）模型简介以及如何使用SGD、ALS和MCMC求解分解机

分解机

2017/11/04 09:27:24

9164

ALS/MCMC/SGD/分解机/推荐系统

高斯分布的贝叶斯推断总结

高斯分布是最常见的分布，也是数据挖掘和人工智能中相关统计学习方法所涉及到的最重要的分布之一。使用贝叶斯理论进行统计推断是目前最流行的推断方式。

2017/11/04 09:25:06

7102

正态分布/统计/高斯分布

Python之numpy.argpartition

Python之numpy.argpartition

神秘的numpy.argpartition

2017/10/24 22:07:29

13313

argpartition/Python

今日推荐

预训练大语言模型的三种微调技术总结：fine-tuning、parameter-efficient fine-tuning和prompt-tuning

Java爬虫入门简介（二） —— HttpClient详细使用方法

【转载】变分贝叶斯算法理解与推导

Awesome ChatGPT Prompts——一个致力于提供挖掘ChatGPT能力的Prompt收集网站

大模型多模态评测基准MMMU介绍

PandasTutor——一个用于可视化pandas操作的神器

20条关于DeepSeek的FAQ解释DeepSeek发布了什么样的模型？为什么大家如此关注这些发布的模型？他们真的绕过CUDA限制，打破了Nvidia的护城河了吗？

最像OpenAI的企业Anthropic的重大产品更新：GPT-4最强竞争模型Claude2发布！免费！具有更强的代码能力与更长的上下文！

华盛顿大学提出QLoRA及开源预训练模型Guanaco：将650亿参数规模的大模型微调的显存需求从780G降低到48G！单张显卡可用！

最热博客

Dirichlet Distribution（狄利克雷分布）与Dirichlet Process（狄利克雷过程）

回归模型中的交互项简介（Interactions in Regression）

贝塔分布（Beta Distribution）简介及其应用

矩母函数简介（Moment-generating function）

普通最小二乘法（Ordinary Least Squares，OLS）的详细推导过程

使用R语言进行K-means聚类并分析结果

深度学习技巧之Early Stopping（早停法）

H5文件简介和使用

手把手教你本地部署清华大学的ChatGLM-6B模型——Windows+6GB显卡本地部署

Wishart分布简介