Common Voice

De la Viquipèdia, l'enciclopèdia lliure
Common Voice
Modifica el valor a Wikidata
Modifica el valor a Wikidata
Tipusconjunt de dades de veu i proveïment participatiu Modifica el valor a Wikidata
Versió inicial19 juny 2017 Modifica el valor a Wikidata
LlicènciaCC0 Modifica el valor a Wikidata
Disponible en
Característiques tècniques
Dispositiu d'entradapantalla tàctil Modifica el valor a Wikidata
Equip
DistribuidorGoogle Play Modifica el valor a Wikidata
Més informació
Lloc webcommonvoice.mozilla.org (múltiples llengües) Modifica el valor a Wikidata

Common voice és un projecte col·laboratiu iniciat per Mozilla[1] per crear una base de dades lliure de veus en diferents idiomes usable per programari de reconeixement de la parla. Els voluntaris enregistren frases de mostra amb un micròfon i revisen els enregistraments d'altres usuaris. Les frases transcrites seran recollides en una base de dades de veu disponible sota llicència del domini públic. Aquesta llicència assegura que els desenvolupadors poden utilitzar la base de dades per a aplicacions de veu a text sense restriccions o costos.

El projecte Common Voice va aparèixer com a resposta als assistents de veu de grans empreses com Eco d'Amazon, Siri o Google Assistant.

A més del conjunt de dades del Common Voice, també estan construint un motor de reconeixement de veu de codi obert anomenat Deep Speech.[2] La Generalitat de Catalunya, a través del Projecte AINA, va iniciar una campanya per animar la ciutadania a col·laborar amb el projecte.[3]

Base de dades de veu[modifica]

La base de dades anglesa de Common Voice és la segona major base de dades de veu accesible lliurement, després de LibriSpeech. Quan el 29 de novembre de 2017 es van publicar les dades per primer cop, més de 20,000 usuaris d'arreu del món havien enregistrat 400,000 sentències validades amb una durada total de 500 hores.[4]

Poc després de l'obertura a totes les llengües el juny de 2018, l'associació Softcatalà va iniciar el projecte per a la llengua catalana.[5] El febrer de 2022 el català va superar les 1.000 hores enregistrades i les 900 hores validades.[6] Un any després, el març de 2023, es va consolidar en la segona posició d'enregistraments amb la superació de les 3.000 hores enregistrades i es va col·locar a 200 hores de desplaçar l'anglès en la primera posició.[7] Així mateix, el 29 de març va superar les 2.000 hores validades del ruandès i es va enfilar fins a la segona posició en termes de validació.[7]

El febrer de 2019 es van alliberar els primers lots d'idiomes usables. Va incloure 18 llengües: anglès, francès, alemany i xinès, però també altres llengües com gal·lès i cabilenc. En total, va incloure gairebé 1,400 hores de dades de veu de més de 42.000 col·laboradors.[8]

Referències[modifica]

  1. «Common Voice by Mozilla» (en anglès). Arxivat de l'original el 2020-02-27. [Consulta: 8 desembre 2019].
  2. «A TensorFlow implementation of Baidu's DeepSpeech architecture: mozilla/DeepSpeech», 08-12-2019. [Consulta: 8 desembre 2019].
  3. «La Generalitat vol la teva veu perquè el Siri i l’Alexa parlin en català». [Consulta: 6 maig 2022].
  4. White, Sean. «Announcing the Initial Release of Mozilla’s Open Source Speech Recognition Model and Voice Dataset» (en anglès americà). [Consulta: 8 desembre 2019].
  5. Jané, Carmen. «Softcatalà i Mozilla impulsen un assistent de veu lliure en català», 12-08-2018. [Consulta: 31 maig 2021].
  6. «El català supera les 1.000 hores enregistrades al projecte Common Voice», 11-02-2022. [Consulta: 9 abril 2022].
  7. 7,0 7,1 «El català supera les 3.000 hores de gravació a Common Voice i ja és la segona llengua amb més minuts enregistrats i validats». Plataforma-Llengua.cat, 29-03-2023. [Consulta: 30 març 2023].
  8. «Mozilla updates Common Voice dataset with 1,400 hours of speech across 18 languages» (en anglès americà), 28-02-2019. [Consulta: 8 desembre 2019].

Enllaços externs[modifica]