Mozilla colaborando no desenvolvimento de IA que converte fala em texto

O grupo Mozilla Ocho trabalha no desenvolvimento do Whisperfile, para traduções de áudio para texto fáceis.

O modelo Whisper é um modelo de conversão de fala em texto do OpenAI que utilizado para transcrever arquivos de áudio.

Ele é treinado em um grande conjunto de dados de áudio e texto em inglês e otimizado para transcrever arquivos de áudio que contêm fala neste idioma. Também é capaz de traduzir áudio não-inglês para inglês como parte do processo de transcrição.

Pode ser facilmente executados nos sistemas Linux, Windows, macOS, FreeBSD, OpenBSD e NetBSD.

Fonte: phoronix.

1 curtida