BG

BGE-Large-en-v1.5

embedding模型

BAAI General Embedding - Large-EN-1.5

发布时间: 2023-09-12

模型参数(Parameters)
3.26
最高上下文长度(Context Length)
512
是否支持中文
不支持
推理能力(Reasoning)

模型基本信息

是否支持推理过程

不支持

最高上下文输入长度

512 tokens

最长输出结果
暂无数据
模型类型

embedding模型

发布时间

2023-09-12

模型预文件大小

1.34GB

开源和体验地址

代码开源状态
预训练权重开源
MIT License - 免费商用授权
GitHub 源码
Hugging Face
在线体验
暂无在线体验地址

官方介绍与博客

官方论文
DataLearnerAI博客
暂无介绍博客

API接口信息

接口速度(满分5分)
暂无数据
接口价格
输入价格:
  • 文本: 暂无数据
  • 图片: 暂无数据
  • 音频: 暂无数据
  • 视频: 暂无数据
  • Embedding: 暂无数据
输出价格:
  • 文本: 暂无数据
  • 图片: 暂无数据
  • 音频: 暂无数据
  • 视频: 暂无数据
  • Embedding: 暂无数据

输入支持的模态

文本

输入不支持

图片

输入不支持

视频

输入不支持

音频

输入不支持

Embedding(向量)

输入不支持

输出支持的模态

文本

输出不支持

图片

输出不支持

视频

输出不支持

音频

输出不支持

Embedding(向量)

输出不支持

BGE-Large-en-v1.5模型在各大评测榜单的评分

发布机构

北京智源人工智能研究院
北京智源人工智能研究院
查看发布机构详情

模型介绍

北京智源人工智能研究院开源的向量大模型,bge-large-en-v1.5是其参数规模最大的一个,有3.26亿参数,英文版。完全开源。在MTEB和C-MTEB上得分都非常高。


1.5版本的bge-large-en-v1.5主要减轻了相似性分布问题,并加强了无需指令的检索能力。


该模型最高输入512个tokens,输出的向量维度是1024。

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号,接受最新大模型资讯

DataLearnerAI WeChat