DeepSeek是幻方量化旗下的一家大模型企业。幻方量化是中国知名的私募巨头,根据此前的信息,幻方量化有1万多张A100显卡,在美国显卡禁令之前用于量化投资。
DeepSeek成立与2023年7月份,致力于探索人工智能本质。他们发布了多个开源大语言模型,包括DeepSeek LLM、DeepSeek Coder等多个模型,在多项评测中都有非常好的表现。
2024年12月,DeepSeekAI开源DeepSeek V3模型,因为其良好的性能、巨大的创新和友好的开源协议引起了国内外广泛的关注。特别是其架构的创新,用较低的成本训练出媲美全球顶尖模型的效果进而引起了大家的关注。
2025年1月20日,DeepSeekAI开源了DeepSeek R1推理大模型,其性能接近OpenAI的o1模型,且完全开源,再次引起了全球的关注。
DeepSeek的GitHub开源地址: https://github.com/deepseek-ai
DeepSeek官方的大模型地址: https://chat.deepseek.com/