Voz Comum

Voz Comum
Logotipo do Common Voice
Visualização da página inicial do Common Voice em abril de 2021
Visualização da página inicial do
Common Voice em abril de 2021
Endereço commonvoice.mozilla.org
Descrição Projeto de miriadização de um banco de dados de fala livre, destinado a designers de ferramentas de processamento automático de linguagem
Comercial Não Não
Publicidade Não Não
Tipo de site Plataforma para gravação e repetição de frases, apresentação do projeto e download de conjuntos de dados
Língua Multilíngue ( lista de idiomas )
Cadastro opcional opcional
Proprietário Fundação Mozilla
Criado por Mozilla Foundation e a comunidade Mozilla
Lançar 19 de junho de 2017
Estado atual Em atividade Em atividade

Common Voice é um projeto de miriadização iniciado pela Mozilla com o objetivo de produzir um banco de dados gratuito para reconhecimento automático de voz . É apoiado por voluntários que gravam frases com um microfone e conferem as gravações de outros usuários. Os áudios e suas transcrições são então reunidos em um banco de dados de domínio público , sob a licença CC0 . Esta licença permite que os desenvolvedores usem o banco de dados de voz para seus aplicativos de fala para texto (STT) sem custos ou restrições.

O projeto usa Amazon Web Services e Google Fonts .

Meta

O objetivo do Common Voice é coletar várias amostras de voz. De acordo com Katharina Borchert, diretora de inovação da Mozilla , muitos projetos de reconhecimento de voz existentes recuperaram seus dados de rádios públicas, e os conjuntos de dados tradicionais tendem a sub-representar mulheres e pessoas com deficiência.

Estatisticas

O banco de dados Common Voice em inglês é o segundo maior banco de dados de acesso livre para esse idioma, depois do LibriSpeech. Quando os primeiros dados foram publicados em 29 de novembro de 2017, mais de 20.000 usuários em todo o mundo haviam gravado e validado 400.000 sentenças, para uma duração cumulativa de 500 horas de gravações de áudio .

Em fevereiro de 2019, um primeiro lote de idiomas foi aberto para reutilização. Incluía 18 idiomas, incluindo inglês , francês , alemão e chinês mandarim , mas também idiomas menos usados, como galês e cabila . No total, quase 1.400 horas de vozes já foram gravadas por mais de 42.000 colaboradores. Em julho de 2020, o projeto havia coletado 7.226 horas de gravações de voz em 54 idiomas, incluindo 5.591 horas verificadas pelos colaboradores. Em abril de 2021, mais de 65 idiomas estavam representados na plataforma. O projeto tem mais de 680 horas de gravações de áudio em francês, incluindo mais de 600 horas verificadas por colaboradores

Veja também

Artigos relacionados

links externos

Notas e referências

  1. (dentro) "  Por que TEMOS gênero? As empresas de tecnologia de voz se movem para serem mais inclusivas  ” , em TheGuardian.com ,11 de janeiro de 2020(acessado em 19 de abril de 2020 )
  2. (em) "  Anunciando o lançamento inicial do modelo de conjunto de dados de voz e reconhecimento de voz de código aberto da Mozilla  " no blog mozilla.org ,29 de novembro de 2017(acessado em 7 de abril de 2021 )
  3. (em) "  Mozilla atualiza o conjunto de dados Common Voice com 1.400 horas de fala em 18 idiomas  " no VentureBeat ,28 de fevereiro de 2019
  4. (em) "  As atualizações do Mozilla Common Voice ajudarão a treinar a wakeword 'Hey Firefox' para navegação na web baseada em voz  " [ arquivo10 de março de 2021] , no VentureBeat ,1 ° de julho de 2020(acedida em 1 r abril 2021 )
  5. "  Página" Idiomas "Voice Common  " em Voice Common (acessada 07 de abril de 2021 )
  6. Página de conjuntos de dados "  Common Voice  " , em Common Voice (acessado em 7 de abril de 2021 )