人工智能与大模型最新资讯与技术博客

★ 【置顶】推荐一个国内可以按分钟计费的4090显卡租用公有云，一个小时24GB显存的4090只需要2.37元——仙宫云

大模型的发展速度很快，对于需要学习部署使用大模型的人来说，显卡是一个必不可少的资源。使用公有云租用显卡对于初学者和技术验证来说成本很划算。DataLearnerAI在此推荐一个国内的合法的按分钟计费的4090显卡公有云服务提供商仙宫云，可以按分钟租用24GB显存的4090显卡公有云实例，非常具有吸引力~

4090显卡/仙宫云/显卡公有云/显卡租赁

检索增强生成（RAG）

大模型检索增强生成是一种结合了大规模语言模型的自动生成能力和针对特定数据的检索机制，以提供更准确、信息丰富的输出内容的技术。

查看RAG合集

Long Context

大模型对长上下文的处理能力在于它们能够理解和维持较长篇幅的文本连贯性，有助于提升质量，以及对复杂问题和讨论的理解和回应质量。

LongContext合集

AI Agent

大模型的AI Agent是一种高级智能系统，能够理解复杂的指令和查询，并以人类般的方式生成响应、执行任务或提供决策支持。

AI Agent合集

重磅！百度文心一言开源，包含2个多模态大模型，4个大语言模型，最大参数量4240亿！完全免费商用授权！

今天，百度正式宣布开源其最新的旗舰级大模型系列——ERNIE 4.5。ERNIE 4.5系列模型当前包含2个多模态大模型，4个大语言模型及其不同变体的庞大家族，还区分了PyTorch版本和paddlepaddle版本，共23个模型，其核心采用了创新的异构多模态混合专家（MoE）架构，在提升多模态理解能力的同时，实现了文本处理性能的同步增强。每个版本的模型都开源了基座（Base）版本和后训练版本（不带Base）。

2025/06/30 13:44:47

190

ERINE/ERINE-4.5/开源大模型

阿里达摩院正式发布了全新的Qwen VLo大模型：全新一代理解与生成合一的多模态大模型

2025年6月26日，阿里达摩院正式发布了全新的Qwen VLo大模型。这是继QwenVL和Qwen2.5 VL后，阿里在多模态大模型领域又一具有里程碑意义的创新。Qwen VLo是一款统一的多模态理解与生成模型，不仅具备深度理解图片与文本内容的能力，更能基于这种理解实现高质量和高度一致的图像生成与编辑，真正跨越了“感知”与“创造”的界限。

2025/06/30 00:12:48

QwenVLo

大模型可以运营自动售货机吗？Anthropic的Project Vend实验：Claude能成功经营一家小店吗？答案是亏损严重还会免费赠送商品！

昨天，Anthropic公布了一项引人注目的实验——Project Vend。他们让旗下的大模型Claude Sonnet 3.7在一个真实的办公环境中，自主经营一家小型自动化商店，为期约一个月。这个实验的目标是探索，在不久的将来，AI模型在真实经济体中自主运行任务的可行性、潜在的成功模式以及那些出人意料的失败方式。实验结果非常强大，也充满了令人深思的细节！

2025/06/28 08:58:33

236

Anthropic/Claude/大模型应用

腾讯开源Hunyuan-A13B大模型：MoE架构，混合推理（支持直接回复和带推理过程后回复），原WizardLM团队打造，评测结果超Qwen2.5-72B，接近Qwen3-A22B，但参数量只有一半

腾讯发布并开源了其混元大模型系列的新成员Hunyuan-A13B。该模型定位为一个基于细粒度专家混合（MoE）架构的大语言模型。其主要特点是高效率和可扩展性，旨在为开发者和研究人员，特别是在资源受限的环境中，提供高级推理和通用应用能力。Hunyuan-A13B是由原来的微软的WizardLM团队成员打造，评测结果超Qwen2.5-72B和Qwen3-A22B

2025/06/27 17:39:57

370

Hunyuan/Hunyuan-A13B/混元大模型

Google开源多模态大模型Gemma3n的正式版：重新定义端侧AI的多模态能力，10B（100亿）参数以下最强多模态大模型，一个月前的预览版正式转正

继Gemma系列模型发布并迅速形成超过1.6亿次下载的繁荣生态后，Google再次推出了其在端侧AI领域的重磅力作——Gemma 3n。这款模型并非一次简单的迭代，而是基于全新的移动优先（mobile-first）架构，旨在为开发者提供前所未有的设备端多模态处理能力。Gemma 3n的定位是成为一款高效、强大且灵活的开源模型，直接与设备端AI领域的其他先进模型（如Phi-4、Llama系列的小参数版本）竞争，其核心特性在于原生支持图像、音频、视频和文本输入。

2025/06/27 09:08:40

207

Gemm3n/Gemma系列/Google/多模态大模型

Gemini CLI: Google发布的开源AI智能体，将Gemini 2.5 Pro直接带入你的终端，每天可以免费使用1000次Gemini 2.5 Pro！

今天，Google为全球开发者社区带来了一款激动人心的新工具——**Gemini CLI**。这是一款免费、开源的AI智能体，它将Google当前最强大的模型Gemini 2.5 Pro的能力，直接集成到了开发者最熟悉的命令行界面（CLI）中。对于那些视终端为“家”的开发者来说，这无疑是一个重大的升级。它不仅擅长编码，更是一个可以处理内容生成、问题解决、深度研究和任务管理的多功能本地实用工具。它的发布，旨在为个人开发者提供前所未有的便捷AI体验，非常强大！

2025/06/26 08:46:37

374

ClaudeCode/GeminiCLI/命令行AI

为什么Qwen3系列模型中没有720亿参数规模的Qwen3-72B？Qwen3-72B还会发布吗？NO！

Qwen3 是阿里于 2025 年 6 月开源的新一代大模型系列，共发布了 8 个不同参数规模的模型，覆盖从 6 亿到 2350 亿参数的范围，融合了稠密模型和 MoE 架构。值得注意的是，此次未包含此前广受关注的 Qwen-72B 稠密模型版本，阿里表示从 Qwen3 起，超过 30B 参数的模型将统一采用 MoE 架构以优化性能和效率。

2025/06/18 16:23:24

Qwen/Qwen2.572B/Qwen3/千问大模型

Google发布全新Gemini 2.5 Flash Lite：极致速度与性价比的轻量级新选择，实测生成速度最高可超过400 tokens/每秒，能力喜人！堪称甜品级大模型！

今天，Google发布Gemini 2.5 Flash Lite。这是一款专为追求极致速度、超低延迟和高性价比场景打造的轻量级模型。它的发布标志着 Google 正在将旗舰模型的先进能力（如百万级上下文、原生多模态、工具调用等）逐步下放到更轻量、更经济的模型层级。根据 DataLearnerAI 的实测，这款模型的生成速度最高可达 400 tokens/秒，即使在输入达到 18K tokens 的情况下，也依然可以维持在 160+ tokens/秒的性能表现，令人惊喜。

2025/06/18 11:51:32

222

Gemini2.5/Gemini2.5FlashLite/Google

MiniMaxAI开源全球推理长度最长的推理大模型MiniMax-M1：100万tokens输入，最高支持80K的推理长度

MiniMaxAI于2025年6月17日正式发布了其新一代大模型——MiniMax-M1。MiniMax-M1的核心亮点在于结合了混合专家（MoE）架构和创新的闪电注意力（Lightning Attention）机制。MiniMax-M1不仅原生支持高达100万Token的上下文长度，推理的tokens也支持最高80K，是当前支持的最多推理长度的大模型。此外，MiniMax-M1在计算效率上也很高，例如在生成10万Token时，其FLOPs消耗仅为DeepSeek R1的25%！

2025/06/17 23:49:56

166

MiniMax/MiniMax-M1/超长上下文模型

MiniMax-M1与其它模型在不同评测上的对比结果

2025/06/17 13:52:07

法国人工智能初创企业MistralAI发布首个推理模型Magistral：纯RL训练，多语言能力出色，推理速度很快，Magistral Small (24B)版本免费开源，但面对Qwen3和DeepSeek稍显乏力

Mistral AI今天发布了其首个专注于推理能力的系列模型——**Magistral**。这次发布包含两个核心模型：旗舰模型`Magistral Medium`和已开源的`Magistral Small (24B)`。最引人注目的亮点是，Mistral展示了其自研的强化学习（RL）pipeline能够从头开始，仅通过RL训练就将基础模型的推理能力提升到业界顶尖水平，而无需依赖任何其他预先存在的推理模型进行数据蒸馏。这套技术栈非常强大！

2025/06/11 22:45:43

145

Magistral/Mistral/推理大模型

OpenAI发布最强大模型OpenAI o3-pro：业界评价该模型解决复杂问题效果很好，但是回复一句“Hi”也需要三分钟

OpenAI 正式发布了其最新模型 OpenAI o3-pro，这是其旗舰模型 o3 的专业增强版。o3-pro 专为需要“更长时间思考”的复杂任务而设计，其核心亮点在于极致的可靠性和准确性，尤其在数学、科学和编程等专业领域表现卓越。根据OpenAI引入的全新“4/4可靠性”评测标准，o3-pro 的性能远超前代，OpenAI官方强调o3-pro在处理高难度、高风险任务的能力上实现了质的飞跃。

2025/06/11 08:57:28

200

GPT/o3-pro/OpenAI/推理大模型

向量大模型新选择，阿里开源向量大模型Qwen-Embedding和重排序大模型Qwen-Reranker，开源向量检索能力第一名！完全免费开源。

阿里巴巴Qwen团队发布了全新的Qwen3 Embedding系列模型，这是一套基于Qwen3基础模型构建的专用文本向量与重排（Reranking）模型。该系列模型凭借Qwen3强大的多语言理解能力，在多项文本向量与重排任务的Benchmark上达到了SOTA水平，其中8B尺寸的向量模型在MTEB多语言排行榜上排名第一。Qwen3 Reranker模型在多个评测基准上同样大幅超越了现有的主流开源竞品。

2025/06/08 22:01:38

487

Qwen/Qwen-Embedding/向量大模型/重排序大模型