标签为 #编程# 的博客 | 数据学习(Datalearner)

★ 【置顶】推荐一个国内可以按分钟计费的4090显卡租用公有云，一个小时24GB显存的4090只需要2.37元——仙宫云

大模型的发展速度很快，对于需要学习部署使用大模型的人来说，显卡是一个必不可少的资源。使用公有云租用显卡对于初学者和技术验证来说成本很划算。DataLearnerAI在此推荐一个国内的合法的按分钟计费的4090显卡公有云服务提供商仙宫云，可以按分钟租用24GB显存的4090显卡公有云实例，非常具有吸引力~

4090显卡/仙宫云/显卡公有云/显卡租赁

Card image cap

检索增强生成（RAG）

大模型检索增强生成是一种结合了大规模语言模型的自动生成能力和针对特定数据的检索机制，以提供更准确、信息丰富的输出内容的技术。

查看RAG合集

Card image cap

Long Context

大模型对长上下文的处理能力在于它们能够理解和维持较长篇幅的文本连贯性，有助于提升质量，以及对复杂问题和讨论的理解和回应质量。

LongContext合集

Card image cap

AI Agent

大模型的AI Agent是一种高级智能系统，能够理解复杂的指令和查询，并以人类般的方式生成响应、执行任务或提供决策支持。

AI Agent合集

运行dask程序报错：Task exception was never retrieved

运行dask程序报错：Task exception was never retrieved

运行本地dask集群的时候出错Task exception was never retrieved的解决方法

小木

5737

dask/python/编程

Python报Memory Error或者是numpy报ValueError: array is too big; `arr.size * arr.dtype.itemsize` 的解决方法

Python报Memory Error或者是numpy报ValueError: array is too big; `arr.size * arr.dtype.itemsize` 的解决方法

有的时候使用Python遇到内存溢出的问题，但其实机器剩余内存很多。需要注意Python版本是否正确

小木

3815

python/编程

Let's Encrypt的Certbot自动生成证书和自动更新证书

Let's Encrypt的Certbot自动生成证书和自动更新证书

网站启用HTTPS必须制作证书，而证书的制作需要定期更新。这里介绍了Certbot证书自动生成工具和自动更新的方法。并描述了Tomcat如何配置pem证书。

小木

4014

编程/网站

通过命令行的方式建立Dask集群

通过命令行的方式建立Dask集群

Dask的集群启动创建也很简单，有好几种方式，最简单的是采用官方提供dask-scheduler和dask-worker命令行方式。本文描述如何使用命令行方法建立Dask集群。

小木

3306

dask/python/分布式编程

Dask的本地集群配置和编程

Dask提供了多种分布式调度器，当缺少多台服务器时候，也可以通过本地集群来实现单机分布式的计算。这篇博客主要就是介绍如何实现Dask的单机分布式调度器。第一小节是简介，第二节是单机调度器的简写版本，第三节是单机调度器的完整版本，第四节是使用的一些示例。

小木

4682

Dask/Python/分布式处理/编程

Pandas的DataFrame选择行或者列的注意事项

Pandas的DataFrame选择行或者列的注意事项

Pandas中的DataFrame选择某些行和某些列是有很多中操作和选择的，不太容易记，这里整理一下。

小木

7938

pandas/python/编程

Git提交本地文件

Git操作记录

小木

1845

git/svn/编程

Scikit-Learn最新更新简介

Scikit-Learn最新更新简介

Scikit-Learn有很优秀的机器学习处理思想，包括TensorFlow等新框架都借鉴了它的设计思想。最近的更新也让Scikit-Learn更加强大。在描述这个更新之前我们先简单看一下历史，然后让我们一起看看都有什么新内容吧。

小木

3635

sk-learn/人工智能/机器学习/编程

Java中自增操作i++与++i的区别

Java中自增操作i++与++i的区别

在Java中，自增是一种非常常见的操作，在自增中，有两种写法，一种是前缀自增（++i），一种是后缀自增（i++)。这里主要简单介绍两种自增的差别。

小木

2915

java/编程

Java类型转换中valueOf方法和parseInt方法的区别

Java类型转换中valueOf方法和parseInt方法的区别

在Java的类型转换中，我们经常会使用valueOf或者parseInt（parseFloat/parseDouble等）来转换。这二者有什么区别呢？这里简要介绍一下。

小木

4583

Java/编程

Tensorflow中数据集的使用方法（tf.data.Dataset）

Tensorflow中数据集的使用方法（tf.data.Dataset）

Tensorflow中tf.data.Dataset是最常用的数据集类，我们也使用这个类做转换数据、迭代数据等操作。本篇博客将简要描述这个类的使用方法。

小木

13637

python/tensorflow/编程

使用Python的sklearn包做kmeans

使用Python的sklearn包做kmeans

小木

9455

kmeans/python/编程

二叉树（Binary Tree）

二叉树（Binary Tree）

二叉树数据结构中一类重要的数据结构，也是树表家族最为基础的结构。二叉树每个节点最多具有两个子节点。本篇博客将简述二叉树原理和应用。

小木

5293

二叉树/数据结构/树结构/编程

网站开启支持https访问

小木

2327

web/编程/网站

《Effective Java 第三版》笔记之七消除过期的对象引用

《Effective Java 第三版》笔记之七消除过期的对象引用

本文是Effective Java第三版笔记的第七个之消除过期的对象引用，Item 7: Eliminate obsolete object references

小木

2741

effectivejava/java/编程

今日推荐

发现新大陆！（申请领地）

微软发布大语言模型与传统编程语言的集成编程框架——Python版本的Semantic Kernel今日发布

大语言模型的技术总结系列一：RNN与Transformer架构的区别以及为什么Transformer更好

重磅！ChatGLM2-6B免费商用了~

Eclipse使用Maven插件的简单介绍

高斯分布的贝叶斯推断总结

清华大学ChatGLM团队发布AI Agent能力评测工具AgentBench：GPT-4一骑绝尘，chatglm2表现优秀，baichuan-7b排名倒数！

开源大语言模型再次大幅进步：微软团队开源的第二代WizardLM2系列在MT-Bench得分上超过一众闭源模型，得分仅次于GPT-4最新版

开源王者！全球最强的开源大模型Llama3发布！15万亿数据集训练，最高4000亿参数，数学评测超过GPT-4，全球第二！

基于PITF模型的个性化标签推荐

最热博客

Dirichlet Distribution（狄利克雷分布）与Dirichlet Process（狄利克雷过程）

回归模型中的交互项简介（Interactions in Regression）

贝塔分布（Beta Distribution）简介及其应用

矩母函数简介（Moment-generating function）

使用R语言进行K-means聚类并分析结果

普通最小二乘法（Ordinary Least Squares，OLS）的详细推导过程

深度学习技巧之Early Stopping（早停法）

H5文件简介和使用

手把手教你本地部署清华大学的ChatGLM-6B模型——Windows+6GB显卡本地部署

Wishart分布简介