模型详细情况和参数
BAAI General Embedding是北京智源人工智能研究院开源的一系列embedding大模型,支持中文和英文的embedding。效果很好,重要的是免费商用授权!
BAAI General Embedding - base - en是其中的英文版本,是一个中等规模参数的版本。不过官方并未透露其参数大小。该模型的维度是1024,最高支持输入的序列长度是512。在MTEB评分中超过了OpenAI的text-embedding-ada-002,但是比bge-large-en效果稍差( https://www.datalearner.com/ai-models/pretrained-models/bge-large-en )。