最新AI大模型咨询与技术解读——来自DataLearnerAI

★ 【置顶】推荐一个国内可以按分钟计费的4090显卡租用公有云，一个小时24GB显存的4090只需要2.37元——仙宫云

大模型的发展速度很快，对于需要学习部署使用大模型的人来说，显卡是一个必不可少的资源。使用公有云租用显卡对于初学者和技术验证来说成本很划算。DataLearnerAI在此推荐一个国内的合法的按分钟计费的4090显卡公有云服务提供商仙宫云，可以按分钟租用24GB显存的4090显卡公有云实例，非常具有吸引力~

4090显卡/仙宫云/显卡公有云/显卡租赁

检索增强生成（RAG）

大模型检索增强生成是一种结合了大规模语言模型的自动生成能力和针对特定数据的检索机制，以提供更准确、信息丰富的输出内容的技术。

查看RAG合集

Long Context

大模型对长上下文的处理能力在于它们能够理解和维持较长篇幅的文本连贯性，有助于提升质量，以及对复杂问题和讨论的理解和回应质量。

LongContext合集

AI Agent

大模型的AI Agent是一种高级智能系统，能够理解复杂的指令和查询，并以人类般的方式生成响应、执行任务或提供决策支持。

AI Agent合集

Pandas的DataFrame选择行或者列的注意事项

Pandas中的DataFrame选择某些行和某些列是有很多中操作和选择的，不太容易记，这里整理一下。

小木

7920

pandas/python/编程

考虑价格和促销影响的销售预测算法实践

这是一篇来自Towards Data Science上面的一篇个人实践分享，主要是针对销量进行预测。一般来说，销量受到价格、季节等因素影响较大。这里就是考虑这些因素进行的一个实践。值得大家一试。这里我们翻译一下，并对其中的某些工作做一些简单的解释。

小木

4621

Prophet/python/时间序列分析/流量预测

softmax作为输出层激活函数的反向传播推导

softmax作为多标签分类中最常用的激活函数，常常作为最后一层存在，并经常和交叉熵损失函数一起搭配使用。这里描述如何推导交叉熵损失函数的推导问题。

小木

5176

python/人工智能/深度学习

Tensorflow中数据集的使用方法（tf.data.Dataset）

Tensorflow中tf.data.Dataset是最常用的数据集类，我们也使用这个类做转换数据、迭代数据等操作。本篇博客将简要描述这个类的使用方法。

小木

13622

python/tensorflow/编程

pandas的一些使用技巧

pandas的使用

夏天的风

2842

pandas/Python

Microsoft Visual C++ 14.0 is required 的解决方案

Microsoft Visual C++ 14.0 is required

夏天的风

2955

MicrosoftVisualC++14.0isrequired/python

网络爬虫存储数据的三种常见方式及其python实现

网络爬虫

夏天的风

3360

excel/Python/TXT/数据库

用python生成随机数的几种方法

本篇博客主要讲解如何从给定参数的的正态分布/均匀分布中生成随机数以及如何以给定概率从数字列表抽取某数字或从区间列表的某一区间内生成随机数，按照内容将博客分为3部分，并附上代码。

夏天的风

5001

Python/随机数生成

用python绘制散点图

如何使用python绘制简单的散点图

夏天的风

5991

Python/散点图

Python中的Pickle操作（pkl文件解释）

您刚刚经历了一个耗时的过程，将一堆数据加载到python对象中。也许你从数千个网站上爬取了数据。也许你计算了pi的数值。如果您的笔记本电脑电池耗尽或python崩溃，您的信息将丢失。 Pickling允许您将python对象保存为硬盘驱动器上的二进制文件。在你pickle你的对象后，你可以结束你的python会话，重新启动你的计算机，然后再次将你的对象加载到python中。

小木

24373

python/序列化

Ubuntu 命令行指定GPU 运行 Python 程序

somTian

6454

GPU/linux/python

使用sklearn做高斯混合聚类（Gaussian Mixture Model）

小木

14774

python/聚类

使用Python的sklearn包做kmeans

小木

9449

kmeans/python/编程

Python之numpy.argpartition

神秘的numpy.argpartition

Vanessa He

13232

argpartition/Python

Scrapy网络爬虫实战[保存为Json文件及存储到mysql数据库]

十七岁的雨季

6106

python/网络爬虫框架

★ 【置顶】推荐一个国内可以按分钟计费的4090显卡租用公有云，一个小时24GB显存的4090只需要2.37元——仙宫云

检索增强生成（RAG）

Long Context

AI Agent

Pandas的DataFrame选择行或者列的注意事项

考虑价格和促销影响的销售预测算法实践

softmax作为输出层激活函数的反向传播推导

Tensorflow中数据集的使用方法（tf.data.Dataset）

pandas的一些使用技巧

Microsoft Visual C++ 14.0 is required 的解决方案

网络爬虫存储数据的三种常见方式及其python实现

用python生成随机数的几种方法

用python绘制散点图

Python中的Pickle操作（pkl文件解释）

Ubuntu 命令行指定GPU 运行 Python 程序

使用sklearn做高斯混合聚类（Gaussian Mixture Model）

使用Python的sklearn包做kmeans

Python之numpy.argpartition

Scrapy网络爬虫实战[保存为Json文件及存储到mysql数据库]

今日推荐

最热博客