Bandièra01 1180x150: Comuna de Tolosa

Opinion

Common Voice: etapa 1/3

Lo Quentin

Lo Quentin

Apassionat de lengas, ai començat a recuperar la lenga en 2011 e dempuèi ensagi d’obrar per l’occitan coma pòdi.

Mai d’informacions
En octòbre 2018 vos parlèri d’un projècte de la fondacion Mozilla per crear un motor de reconeissença vocala liure. Caliá realizar la traduccion per començar lo projècte. Degun se mostrèt pas interessat. Es solament en novembre 2019 pendent un festenal del logicial libre, Capitole du Libre, que me diguèri qu’èra tròp damatge. Efectivament, pendent lo festenal i aviá una conferéncia amb un emplegat de Mozilla. Sabiá pas dire se l’occitan fasiá part del projècte. Ieu dins lo public sabiái que non... Avètz aquí la vidèo de la conferéncia.
 

 
 
Se me lancèri pas es qu’es un brave trabalh, gaireben impossible solet.
 
Per començar lo projècte cal traduire lo site web de Mozilla Common Voice, 614 cadenas de tèxtes al moment d’escriure aqueste article. Aprèp cal constituir un còrpus de tèxtes de 5 000 frasas almens. Per cada frasa cal que qualqu’un la valide. Un còp lo còrpus creat, començan los enregistraments àudios, mòstras vocalas. Per cada enregistrament cal tanben una validacion, o doas.
 
E ara... quant de temps dura una frasa? Un par de segondas? Per que lo motor d’aprendissatge siasque eficaç li cal 10 000 oras d’enregistrament. Dètz milas oras. Vaquí.
 
En decembre 2019 faguèri lo torn del monde que coneissi per m’ajudar a traduire lo site. 3 personas m’ajudèron a traduire lo site de Common Voice. Los mercegi aquí! Aguèt un contributor anonim tanben, malaürosament amb un occitan tròp tintat d’espanhòl.
 
Vaquí ont sèm del projècte d’aver un motor de reconeissença vocala liure per l’occitan.
 
L’etapa venenta es la creacion d’un còrpus de tèxtes. Vos parlarai d’aquò dins un autre article perque vòli implicar lo monde.
 
Per acabar la traduccion e per fauta de font, daissèrem en anglés lo nom de las lengas seguentas:
 
Adyghe
Dhivehi
Kabardian
Komi-Zyrian
Luganda
Moksha
Meadow Mari
Hill Mari
Erzya
Kinyarwanda
Sakha
Sinhala
Tajik
Ubykh
Udmurt
Karakalpak
Tagalog
 
Se coneissètz la traduccion en occitan, sètz mai que benvengut per participar a la traduccion e partejar vòstre saber!
 
 
 
abonar los amics de Jornalet
 
 

 

Jornalet es possible gràcias al sosten economic e jornalistic dels legeires e benevòls. Se lo podètz sosténer en venent sòci dels Amics del Jornalet o de l'Associacion ADÒC, o tot simplament en fasent un don, atal contribuiretz a far un mèdia mai independent e de melhora qualitat.

Comentaris

Quentin Tolosa
1.

Vos tòrni donar lo ligam per realizar la traduccion dels produches de Mozilla :
https://pontoon.mozilla.org/oc/

E aquí unas explicacions : https://framagit.org/provaires/fonts
Es pas a jorn lo document, manca lo vocabulari novèl coma «criptominaire» o «generador d’emprunta numerica».

  • 0
  • 0

Escriu un comentari sus aqueste article