DeepSeek是幻方量化旗下的一家大模型企业。幻方量化是中国知名的私募巨头,根据此前的信息,幻方量化有1万多张A100显卡,在美国显卡禁令之前用于量化投资。
DeepSeek成立与2023年7月份,致力于探索人工智能本质。他们发布了多个开源大语言模型,包括DeepSeek LLM、DeepSeek Coder等多个模型,在多项评测中都有非常好的表现。
2024年12月,DeepSeekAI开源DeepSeek V3模型,因为其良好的性能、巨大的创新和友好的开源协议引起了国内外广泛的关注。特别是其架构的创新,用较低的成本训练出媲美全球顶尖模型的效果进而引起了大家的关注。
2025年1月20日,DeepSeekAI开源了DeepSeek R1推理大模型,其性能接近OpenAI的o1模型,且完全开源,再次引起了全球的关注。DeepSeek-R1发布后,其AI助手迅速成为苹果iPhone应用商店中下载量最高的免费应用。这一快速崛起引发了美国科技行业的关注,分析师担忧DeepSeek的高效和低成本模式可能会对美国产生竞争压力。
与许多竞争对手不同,DeepSeek坚持开源,其模型和代码均可免费下载、修改和使用。这一策略促进了行业合作,加快了AI技术的创新步伐。
DeepSeek的GitHub开源地址: https://github.com/deepseek-ai
DeepSeek官方的大模型地址: https://chat.deepseek.com/