统计、机器学习与编程知识的原创博客

★ 【置顶】推荐一个国内可以按分钟计费的4090显卡租用公有云，一个小时24GB显存的4090只需要2.37元——仙宫云

大模型的发展速度很快，对于需要学习部署使用大模型的人来说，显卡是一个必不可少的资源。使用公有云租用显卡对于初学者和技术验证来说成本很划算。DataLearnerAI在此推荐一个国内的合法的按分钟计费的4090显卡公有云服务提供商仙宫云，可以按分钟租用24GB显存的4090显卡公有云实例，非常具有吸引力~

4090显卡/仙宫云/显卡公有云/显卡租赁

检索增强生成（RAG）

大模型检索增强生成是一种结合了大规模语言模型的自动生成能力和针对特定数据的检索机制，以提供更准确、信息丰富的输出内容的技术。

查看RAG合集

Long Context

大模型对长上下文的处理能力在于它们能够理解和维持较长篇幅的文本连贯性，有助于提升质量，以及对复杂问题和讨论的理解和回应质量。

LongContext合集

AI Agent

大模型的AI Agent是一种高级智能系统，能够理解复杂的指令和查询，并以人类般的方式生成响应、执行任务或提供决策支持。

AI Agent合集

Java中自增操作i++与++i的区别

在Java中，自增是一种非常常见的操作，在自增中，有两种写法，一种是前缀自增（++i），一种是后缀自增（i++)。这里主要简单介绍两种自增的差别。

2019/09/07 15:17:28

2939

java/编程

Eclipse安装SVN插件

使用SVN进行项目的版本管理是非常流行的操作，这篇博客将描述Eclipse安装SVN的方法。

2017/09/01 15:48:48

2968

eclipse/svn/编程

如何让大模型（GPT）按照特定的JSON格式输出？OpenAI给出新答案：GPT模型现在可以支持更加友好和精确的格式化JSON输出了！

今天，OpenAI官方宣布GPT接口新增一个能力：即支持以更加精确的JSON视图格式返回大模型的结果。比去年的单纯的让GPT输出JSON更加强大，它可以确保模型生成的输出能够完全匹配开发者提供的JSON模式。这种能力是在官方的API接口中增加了`return_format={"type":"json_schema","json_schema": {...}}`参数实现的。但是仅支持最新的模型版本，但这可能是未来的趋势！

2024/08/07 23:24:09

2973

GPT-4o/JSON输出/OpenAI/大模型格式化输出/大模型输出

TensorFlow学习——基本概念（1）

TensorFlow基本概念

2019/03/27 21:18:22

2991

TensorFlow基本概念

Microsoft Visual C++ 14.0 is required 的解决方案

Microsoft Visual C++ 14.0 is required

2019/03/27 21:15:19

3001

MicrosoftVisualC++14.0isrequired/python

Keras框架下的保存模型和加载模型

2019/03/27 21:19:46

3004

Keras框架下的保存模型和加载模型

MySQL8授权用户远程连接失败，提示ERROR 1410 (42000): You are not allowed to create a user with GRANT

原来直接用root账户授权远程访问失败，最新的MySQL8不允许直接创建并授权用户远程访问权限，必须先让自己有GRANT权限，然后创建用户，再授权。

2022/07/31 12:55:02

3013

mysql

R语言操作数据库

2016-05-25 22:00:24

3018

R语言/数据库

Baichuan系列大语言模型升级到第二代，百川开源的Baichuan2系列大模型详解，能力提升明显，依然免费商用授权

百川智能是前搜狗创始人王小川创立的一个大模型创业公司，主要的目标是提供大模型底座来提供各种服务。虽然成立很晚（在2023年4月份成立），但是三个月后便发布开源了Baichuan系列开源模型，并上架了Baichun-53B的大模型聊天服务。这些模型受到了广泛的关注和很高的平均。而2个月后，百川智能再次开源第二代baichuan系列大模型，其能力提升明显。

2023/09/09 10:28:29

3018

Baichuan2/baichuan2大模型/百川

三层Dirichlet 过程(非参贝叶斯模型)-来自Machine Learning

2018/04/20 22:20:24

3029

三层Dirichlet过程

Topic model相关文章汇总

2017/11/15 08:42:59

3030

主题模型

财大气粗！英伟达官方AI Playground提供可以免费使用的Stable Diffusion XL、LLaMA2、CLIP等模型

AI Playground最近的LLaMA2、Stable Diffusion XL等模型的进展也让大家看到了最新最强大的模型的能力。但是，对于大多数人来说，这些模型的使用依然具有较高的门槛，除了硬件资源消耗大，本身的部署也不容易。而支撑这些模型的一个重要的硬件因素就是英伟达的显卡。显卡已经超越一般理财，变得越来越贵。因此，基于大模型的免费服务成本也很高，而今天，英伟达官方的NGC网站推出了新的几款可以免费使用的大模型，包括聊天大模型LLaMA2、文本生成图片大模型Stable Diffusion等，基于

2023/08/10 13:43:21

3045

StableDiffusionXL/免费资源

tokens危机到来该怎么办？新加坡国立大学最新研究：为什么当前的大语言模型的训练都只有1次epoch？多次epochs的大模型训练是否有必要？

epoch是一个重要的深度学习概念，它指的是模型训练过程中完成的一次全体训练样本的全部训练迭代。然而，在LLM时代，很多模型的epoch只有1次或者几次。这似乎与我们之前理解的模型训练充分有不一致。那么，为什么这些大语言模型的epoch次数都很少。如果我们自己训练大语言模型，那么epoch次数设置为1是否足够，我们是否需要更多的训练？

2023/05/31 00:33:36

3049

tokens/大语言模型/正则化/训练技术