Whisper

Whisper基本信息

模型发布时间: 2022-09-21

模型发布机构: OpenAI

模型所属类型: 多模态学习

模型官方地址:

Whisper大模型详细介绍

Whisper是由OpenAI在2022年开源的ASR(Automatic Speech Recognition)模型,它在英语语音识别方面接近人类水平的鲁棒性和准确性。


它是在从互联网收集的68万小时的多语种和多任务监督数据上训练的。使用如此大量和多样化的数据集可提高识别口音、背景噪声和技术语言的鲁棒性。此外,它还能够转录多种语言,并将这些语言翻译成英语。


这也是OpenAI今年为数不多的开源模型。

欢迎大家关注DataLearner官方微信,接受最新的AI技术推送
datalearner-wechat
基于Whisper微调的模型列表