Whisper V2 - Whisper V2

模型详细情况和参数

Whisper V2

模型全称
Whisper V2
模型简称
Whisper V2
模型类型
发布日期
2022-12-09
预训练文件大小
6.17
模型参数数量(亿)
15.5
代码是否开源
预训练结果是否开源
预训练结果商用授权情况
发布论文名(官方博客名)
Robust Speech Recognition via Large-Scale Weak Supervision
论文地址(官方博客地址)
https://arxiv.org/abs/2212.04356
基础模型
...
Whisper
查看详情
发布机构

Whisper V2 简介

Whisper V2是OpenAIWhisper的第二个版本,它的参数与第一个版本中最大的模型一致,15.5亿。它是第一个模型继续训练了2.5倍的结果,且新增了SpecAugment、Stochastic depth和BPE Dropout等正则化技术。除此之外,模型架构和参数大小均与第一个版本相同。


Whisper第一个版本的模型如下:


第二个版本就是large的v2版本。‘


Whisper V2版本的官方发布说明: https://github.com/openai/whisper/discussions/661 

欢迎大家关注DataLearner官方微信,接受最新的AI模型和技术推送

Whisper V2所属的领域
多模态学习

多模态学习

Multimodal Learning

35个资源

Whisper V2相关的任务
自动语音识别

自动语音识别

Automatic Speech Recognition

35个资源