DataLearner 标志DataLearnerAI
AI技术博客
大模型评测排行
大模型评测基准
AI大模型大全
AI资源仓库
AI工具导航

加载中...

DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
页面导航
目录
大模型列表Falcon 7B
FA

Falcon 7B

Falcon 7B

发布时间: 2023-04-24更新于: 2023-05-26 22:52:48.026186
在线体验GitHubHugging Face
模型参数
70.0亿
上下文长度
2K
中文支持
不支持
推理能力

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

模型基本信息

推理过程
不支持
上下文长度
2K tokens
最大输出长度
暂无数据
模型类型
基础大模型
发布时间
2023-04-24
模型文件大小
14.33GB
MoE架构
否
总参数 / 激活参数
70.0 亿 / 不涉及
知识截止
暂无数据
推理模式
暂无模式数据

开源和体验地址

代码开源状态
暂无数据
预训练权重开源
暂无数据
GitHub 源码
暂无GitHub开源地址
Hugging Face
https://huggingface.co/tiiuae/falcon-7b
在线体验
暂无在线体验地址

官方介绍与博客

官方论文
暂无官方论文
DataLearnerAI博客
暂无介绍博客

API接口信息

接口速度
暂无数据
暂无公开的 API 定价信息。

评测得分

当前尚无可展示的评测数据。

发布机构

The Technology Innovation Institute
The Technology Innovation Institute
查看发布机构详情

模型解读

Falcon-7B是由TII开发的一种7B参数的因果解码器模型,它在RefinedWeb上训练了1,500B个令牌,RefinedWeb是一个经过筛选和去重的高质量网络数据集,TII还在其中增加了精选的语料库。Falcon-7B的许可证是TII Falcon LLM License,允许商业使用。

模型的特点包括:

  1. 性能优越:Falcon-7B超过了相似的开源模型(例如,MPT-7B、StableLM、RedPajama等),这得益于它在1,500B令牌的RefinedWeb上进行了训练,这个数据集还增加了精选的语料库。具体的性能可以在OpenLLM Leaderboard上查看。
  2. 优化的架构:Falcon-7B采用了优化的架构,包括FlashAttention(Dao等人,2022年)和multiquery(Shazeer等人,2019年)。
  3. 适用于商业使用:Falcon-7B的许可证允许商业使用。
  4. 预训练模型:Falcon-7B是一个原始的预训练模型,应该进一步微调以适应大多数用例。
模型的训练细节

Falcon-7B在384个A100 40GB GPUs上进行训练,使用了2D并行策略(PP=2,DP=192)和ZeRO。训练开始于2023年3月初,持续了大约两周。

模型的技术规格:

Falcon-7B是一个因果解码器模型,训练任务是因果语言建模(即预测下一个令牌)。它的架构主要参考了GPT-3论文(Brown等人,2020年),但有以下区别:

  • 位置嵌入:旋转(Su等人,2021年);
  • 注意力:multiquery(Shazeer等人,2019年)和FlashAttention(Dao等人,2022年);
  • 解码器块:并行注意力/MLP,带有单层规范。

Falcon-7B在AWS SageMaker上进行训练,使用了384个A100 40GB GPUs的P4d实例。它使用了一个定制的分布式训练代码库,Gigatron,它使用了3D并行方法,结合了ZeRO和高性能的Triton内核(FlashAttention等)。


许可证

Falcon-7B在TII Falcon LLM License下提供。大致来说,你可以自由地用我们的模型进行研究和/或个人目的;你可以分享和构建这些模型的衍生物,但你需要给出归因,并以相同的许可证分享;对于商业用途,如果可归因的收入低于每年1M美元,你可以免除版税支付,否则你应该与TII签订商业协议。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码