O grupo Mozilla Ocho trabalha no desenvolvimento do Whisperfile, para traduções de áudio para texto fáceis.
O modelo Whisper é um modelo de conversão de fala em texto do OpenAI que utilizado para transcrever arquivos de áudio.
Ele é treinado em um grande conjunto de dados de áudio e texto em inglês e otimizado para transcrever arquivos de áudio que contêm fala neste idioma. Também é capaz de traduzir áudio não-inglês para inglês como parte do processo de transcrição.
Pode ser facilmente executados nos sistemas Linux, Windows, macOS, FreeBSD, OpenBSD e NetBSD.
Fonte: phoronix.