BGE-M3-Embedding-Unsupervised - BGE-M3-Embedding-Unsupervised

模型详细情况和参数

BGE-M3-Embedding-Unsupervised

模型全称
BGE-M3-Embedding-Unsupervised
模型简称
BGE-M3-Embedding-Unsupervised
模型类型
embedding模型
发布日期
2024-01-30
预训练文件大小
2.27GB
是否支持中文(中文优化)
最高支持的上下文长度
8K
模型参数数量(亿)
1.13
模型代码开源协议
MIT License
预训练结果开源商用情况
MIT License - 免费商用授权
在线演示地址
暂无
DataLearnerAI的模型介绍
基础模型
无基础模型

BGE-M3-Embedding-Unsupervised 简介

BGE-M3-Embedding是北京智源人工智能研究院开源的一个最新的Embedding大模型,最大的特点是功能很多,体现在三个层面,包括支持100多种语言、支持短句到长文(最高8K输入)、以及支持多种不同的功能。


BGE-M3-Embedding有2个版本,一个是在大量数据做 contrastive learning之后得到的一个无监督版本(bge-m3-unsupervised),就是本模型。还有一个微调版本,参考: https://www.datalearner.com/ai-models/pretrained-models/BGE-M3-Embedding 

    欢迎大家关注DataLearner官方微信,接受最新的AI模型和技术推送

    BGE-M3-Embedding-Unsupervised所属的领域
    自然语言处理

    自然语言处理

    Natural Language Process

    35个资源

    BGE-M3-Embedding-Unsupervised相关的任务
    文本嵌入

    文本嵌入

    Embedding

    35个资源