Com podem ajudar per disposar d’aquests productes en català.

Probablement molts dies quan us voleu comunicar amb els enginys diversos que teniu a la vostra llar, sigui l’Alexa o Google Home a la llar o bé amb els vostres telèfons inte·ligents la Siri d’Apple trobeu a faltar fer-ho en català d’una forma normalitzada com ho farieu en anglès o espanyol.

Si bé l’Alexa arriba a entendre -amb prou feines -què vols que et posi si li dius tal qual: ‘Catalunya Ràdio’, i t’obre l’ ‘skill de Catalunya Ràdio, encara no t’enten pas si li fas qualsevol pregunta en català. Com a molt et remet a una llista de música en català del seu repertori musical en obert.

Doncs per anar millorant tot això hi podem col·laborar de forma simple, ja des de fa temps amb iniciatives com Mozilla Common Voice, tal com ens ho expliquen des de Softcatalà.

Tots aquests productes requereixen esforços específics per adaptar les funcionalitats addicionals. Assumim que es comença només amb el nivell domèstic.

Per tal de donar suport al català, cal adaptar-hi multitud de sistemes:(vegeu aquesta entrada del blog d’Amazon Science, en anglès):

  • Reconeixement de veu
  • Síntesi de veu
  • Sistemes de diàleg
  • Sistemes d’extracció de coneixement (ràdios, diaris, cartelleres de cinema, etc.)
  • Selecció de continguts (p. ex. recomanacions)

Totes i cadascuna d’aquestes peces són necessàries per a tenir un assistent digital de veu d’àmbit general d’una qualitat mínima, i no s’hi valen pedaços per a fer pont a través d’una altra llengua.

Dades Common Voice en Català

Els projectes com Mozilla Common Voice, una iniciativa per a ajudar a ensenyar a les màquines com parlen les persones de veritat, han estat rellançats amb una campanya desde la Generalitat amb el projecte Aina, si volem que les màquines ens entenguin quan els parlem en català i ens responguin en la nostra llengua, cal que primer l’aprenguin. Per això, s’han d’aconseguir milions i milions d’hores de veu en català de persones de tots els gèneres, edats, varietats dialectals i registres.

Existeixen dos tipus de recursos que es poden oferir: els models d’IA entrenats i les dades.

Els models d’IA els podem descartar perquè les grans empreses tecnològiques usen arquitectures de models pròpies, molt personalitzades. A més, per motius de control, incloent-hi privadesa i seguretat, no fan servir models de tercers. 

Hi ha les dades, que és on hi ha un marge d’oportunitat. Només se’ls podrà facilitar una part, de la qual, només utilitzaran la part que compleixi amb els seus requisits.

D’altra banda, tots els assistents tenen funcionalitat addicional feta per tercers (a través d’habilitats, skills). Per exemple, que Alexa estigui en català vol dir que la part que controla Amazon ho estarà, però llavors cal també treballar amb la comunitat de desenvolupadors per adaptar les habilitats principals i que el producte sigui útil per als usuaris.

Una vegada un producte s’ha adaptat a una llengua cal un esforç sostingut en el temps per mantenir-ho: noves funcionalitats, avenços constants d’IA que cal aplicar, millores de les dades constant.

Des de Softcatalà s’ha estat treballat en l’adaptació de Mycroft (un assistent de veu de codi obert) al català, i que podeu provar aquí. És una prova de concepte, però està disponible per a qualsevol fabricant que vulgui dur a terme un producte comercial d’assistent de veu en català.

És possible que veiem abans Siri d’Apple o Google Home en català, ja que són empreses que han apostat tradicionalment pel català i tenen ja parts desenvolupades. Però, com dèiem, la decisió final és d’aquestes.

Com podem col·laborar per a tenir un assistent de veu en català?

L’acció individual i col·lectiva pot ajudar molt per a aconseguir -ho

Què pots fer:

  1. Facilitant dades per a reduir l’esforç de fer tecnologies de llengua en català. Per exemple, Common Voice de Mozilla permet elaborar un corpus de veu amb llicència lliure, disponible per a tothom.
  2. Reclamant a les empreses que afegeixin el català als seus productes i serveis, i tenir en compte el criteri lingüístic en comprar o contractar productes i serveis.
  3. Vetllant perquè les administracions públiques respecten i garanteixin els drets lingüístics dels ciutadans, també en l’àmbit tecnològic. De manera que els ciutadans no hagin de renunciar al català en els serveis oferts a través de webs, aplicacions i d’aparells tecnològics.
Adaptació de Softcatalà, contingut disponible El contingut està disponible sota la llicència CC Reconeixement-Compartir Igual   CC BY-SA 4.0

Inici de la Internet Catalana: De Softcatalà al Google Assistant en català

Trending