模型详细情况和参数
北京智源人工智能研究院开源的向量大模型,bge-large-en-v1.5是其参数规模最大的一个,有3.26亿参数,英文版。完全开源。在MTEB和C-MTEB上得分都非常高。
1.5版本的bge-large-en-v1.5主要减轻了相似性分布问题,并加强了无需指令的检索能力。
该模型最高输入512个tokens,输出的向量维度是1024。
自然语言处理
Natural Language Process
35个资源
文本嵌入
Embedding