Ge

Gemma 3 - 27B (IT)

聊天大模型

Gemma 3 - 27B (IT)

发布时间: 2025-03-12

模型参数(Parameters)
270.0
最高上下文长度(Context Length)
128K
是否支持中文
支持
推理能力(Reasoning)

模型基本信息

最高上下文输入长度

128K tokens

最长输出结果
未披露
模型类型

聊天大模型

发布时间

2025-03-12

模型预文件大小

54.8GB

开源和体验地址

代码开源状态
预训练权重开源
Gemma Terms of Use - 免费商用授权
GitHub 源码
暂无GitHub开源地址
Hugging Face
在线体验
暂无在线体验地址

API接口信息

接口速度
暂无数据
接口价格
输入价格:
  • 文本: 暂无数据
  • 图片: 暂无数据
  • 音频: 暂无数据
  • 视频: 暂无数据
  • Embedding: 暂无数据
输出价格:
  • 文本: 暂无数据
  • 图片: 暂无数据
  • 音频: 暂无数据
  • 视频: 暂无数据
  • Embedding: 暂无数据

输入支持的模态

文本

输入不支持

图片

输入不支持

视频

输入不支持

音频

输入不支持

Embedding(向量)

输入不支持

输出支持的模态

文本

输出不支持

图片

输出不支持

视频

输出不支持

音频

输出不支持

Embedding(向量)

输出不支持

Gemma 3 - 27B (IT)模型在各大评测榜单的评分

评测基准名称
MMLU
(知识问答)
评测结果:76.9
评测基准名称
MMLU Pro
(知识问答)
评测结果:67.5
评测基准名称
HumanEval
(代码生成)
评测结果:87.8
评测基准名称
MBPP
(代码生成)
评测结果:74.4
评测基准名称
MATH
(数学推理)
评测结果:89.0
评测基准名称
GPQA Diamond
(常识推理)
评测结果:42.4
评测基准名称
SimpleQA
(真实性评估)
评测结果:10.0
评测基准名称
LiveCodeBench
(代码生成)
评测结果:29.7
评测基准名称
GPQA
(知识问答)
评测结果:36.83

发布机构

模型介绍

Gemma 3 - 27B Instruct是Google的第三代Gemma大模型,27亿参数,指令优化版本。Gemma系列是Google开源的系列大模型,基座模型为Google的Gemini,Gemini是闭源版本。Gemma 3 - 27B Instruct在2025年3月12日出现在Google AI Studio上,开发者可以免费使用。


该模型最多支持8K的输出,输入准确来说131072个tokens。


关于Gemma开源系列模型介绍: https://www.datalearner.com/blog/1051708523708257 


Gemma3-27B 是 Google DeepMind 在 Gemma 3 系列中规模最大、性能最强的版本。相比 12B 版本,它在复杂任务上的表现更为出色,并在多个基准测试中达到或接近 Gemini 1.5 Pro 的水平。该模型支持 128K tokens 长上下文,配备 417M 参数的视觉编码器,在文本生成、代码理解、多模态任务等方面均表现优异。

模型架构与设计

Gemma3-27B 采用 解码器 Transformer 架构,结合 Grouped-Query Attention (GQA) 以优化计算效率,并通过 5:1 的局部/全局注意力交替 机制降低 KV 缓存占用,使其在长文本推理方面具备显著优势。同时,它集成了 SigLIP 视觉编码器,支持 OCR、文档理解等任务。

训练细节

该模型在 TPUv5p 平台 训练,采用 6144 个 TPU,24 数据切分、8 序列切分、32 副本。使用 14T tokens 进行训练,并通过 知识蒸馏 提高性能。此外,后训练阶段采用强化学习优化数学、推理、指令跟随等能力,使其在各类任务上均表现出色。

参数配置

模型版本视觉编码器参数嵌入参数非嵌入参数上下文长度
Gemma3‑12B417M1012M10759M128K tokens
Gemma3‑27B417M1416M25600M128K tokens

基准测试表现

Gemma3-27B 在多个评测中均取得了优异的成绩,接近甚至超越部分封闭大模型,特别是在 MMLU、数学推理、代码生成等方面。

评测基准Gemma3-4BGemma3-12BGemma3-27BGemini 1.5 Pro
MMLU-Pro43.660.667.579.1
LiveCodeBench12.624.629.736.0
Bird-SQL36.347.954.459.3
GPQA Diamond30.840.942.464.7
SimpleQA4.06.310.044.3
MATH75.683.889.091.8

Gemma3-27B 在 LMSYS Chatbot Arena 评测中的排名

在 LMSYS Chatbot Arena 的人类评测中,Gemma3-27B-IT 获得 1338 Elo,位列 前 10,超过 DeepSeek-V3、LLaMA 3 70B、Qwen2.5-70B 等大规模模型,仅次于封闭大模型 GPT-4.5、Gemini-2.0-Pro 等。

排名模型名称Elo 分数参数规模
1Grok-3-Preview-02-241412-
1GPT-4.5-Preview1411-
3Gemini-2.0-Pro-Exp1380-
6DeepSeek-R11363671B/37B
9Gemma3-27B-IT133827B
14Claude 3.7 Sonnet1309-
18Gemini-1.5-Pro-0021302-

模型特点

  • 长文本理解:支持 128K tokens 上下文,在复杂推理任务中表现稳定。
  • 强大的多模态能力:集成视觉编码器,支持 OCR、文档理解等任务。
  • 接近封闭大模型的性能:在多个基准测试中,表现接近 Gemini 1.5 Pro,同时在 LMSYS 评测中位列开源模型前列。

总结

Gemma3-27B 是 Google DeepMind 迄今最强大的开源模型,在多个评测中接近封闭大模型,适用于复杂文本推理、代码生成、多模态任务等高端应用。对于需要最先进 LLM 性能的研究者和开发者来说,它是当前最值得关注的开源选择之一。

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号,接受最新大模型资讯

DataLearnerAI WeChat