JJJ8 perdut en la selva de la llengua
2009/11/01 Roa Zubia, Guillermo - Elhuyar Zientzia Iturria: Elhuyar aldizkaria
Els robots són màquines, no tenen oïda. Per a poder escoltar-ho necessiten un micròfon, digitalitzen aquesta ona de la veu i descobreixen el missatge de l'orador. Enginyers i informàtics han participat en aquest sistema de reconeixement de veu. L'objectiu no és fàcil: la màquina ha de comprendre el missatge amb independència del to i la dicció de l'orador.
Per a això és necessari que la màquina es formi prèviament. Són tècniques d'intel·ligència artificial. Ha d'aprendre. No és estrany, l'home també aprèn així. Els nens triguen anys a conèixer les paraules que se'ls diuen i a atrapar el missatge que se'ls dóna amb la parla. Els adults també fan el mateix quan aprenen un nou idioma. Han de fer "orella". I amb aquest encanteri tampoc acaba el que cal aprendre.
El robot JJ8 És difícil trobar sal en el saló quan rep la frase, ha de fer moltes coses per a comprendre-la. Ja coneix la successió de cinc paraules, però ara ha d'aclarir quina és l'estructura de la frase. Ha de segmentar-se, és a dir, ha de saber que les paraules formen un conjunt intel·ligent, que la paraula sal és una altra, i que la paraula en el saló és una altra. I ha d'aclarir per què formen aquests conjunts i no uns altres.
A més, haurà d'analitzar-ho literalment. Ha de saber que és verb trobar, sal, etc. I ha d'identificar els lemes: identificar el lema que es troba darrere de la paraula trobar. És a dir, ha de ser la forma bàsica de les paraules que ha rebut per a buscar significat.
A través del món humà
De moment, JJ8 no ha entès res. Sap quines paraules componen la frase, com estan organitzades i per on ha de partir per a buscar el significat de cada paraula, però no ha entès res. No té coneixements ni context per a comprendre la frase. Però el següent pas és comprendre el que s'ha dit per Fausto. El cunyat està a punt de submergir-se en el món de l'ambigüitat.
Afortunadament, aquestes paraules no tenen molt sentit. Pel que sembla , la sal és la sal, és a dir, no sembla que aquesta paraula indiqui una altra cosa que no sigui el clorur sòdic. Però no és del tot cert: pot ser sinònim de gràcia o de vitalitat. En aquest cas, JJ8 haurà de descartar aquest significat i aclarir que Fausto es refereix al clorur sòdic.
La forma més eficaç que han inventat els informàtics per a fer-ho és el mètode estadístic. JJJ8 haurà de buscar el lema de sal en molts textos i analitzar amb quines altres paraules apareix habitualment. És un treball difícil, que se li explicarà amb freqüència en textos de caràcter laboratori, però que no l'ajuda. Clarament, el missatge de Fausto no té cap relació amb la química (o almenys el creu). No obstant això, en la majoria dels textos que acompanyen a la sal i al descobriment, la sal serà sinònim de clorur sòdic. No sempre. Però si és així en la majoria dels casos, haurà de prendre una decisió --difícil - a favor d'aquesta accepció. Avui dia, els informàtics han fet una bona feina perquè les màquines prenguin aquest tipus de decisions, i no obstant això, l'estadística no sempre és la millor manera d'aconseguir-lo (és possible que en alguns contextos en els quals coexisteixin paraules de sal i trobar el significat de la sal sigui la gràcia o la vitalitat).
Els informàtics (i els lingüistes) diuen desambiguació al treball de triar el sentit correcte de cada paraula. La màquina és imprescindible per a entendre una conversa i, en molts casos, el principal problema a superar. Però no és l'únic problema.
Per a entendre a Fausto, JJ8 hauria de fer una lectura a un altre nivell. És difícil trobar el veritable significat de la frase No el trobaràs. No obstant això, el grilló JJ8 creu que sí, que difícilment la paraula indica que haurà de fer un esforç especial.
Però el llenguatge de l'home no és clar i directe. Està plagat de metàfores, ironia, hipèrboles i altres trucs. Moltes vegades utilitza una frase per a expressar alguna cosa que no significa aquesta frase. Fins ara diu que sabent que no s'unirà amb ningú. Tens hores? diu preguntar-se quina hora és i no per a confirmar que l'altre té un rellotge que funciona correctament. Hi ha molts altres exemples.
Resposta
JJJ8 ha entès el que ha pogut i respon en funció del que ha entès. Però aquest procés tampoc és fàcil. I és que en una entrevista es necessiten respostes de tota mena. A vegades cal buscar una dada per a respondre. Altres vegades una explicació completa. Altres vegades cal respondre a una provocació. Hi ha de tot.
I buscar cada tipus implica una estratègia pròpia. Novament ens trobem amb la intel·ligència artificial: tècniques de resposta a preguntes, cerca intel·ligent, extraccions d'informació, traducció automàtica d'informació en diversos idiomes, etc. I, per descomptat, també són necessàries combinacions d'aquestes tècniques.
El treball del robot està prenent forma. Es pot dir que buscant la resposta ha fet el més difícil. Però no acaba del tot. Ha de donar forma de parla a aquesta resposta. Utilitzar tècniques de creació lingüística. D'alguna manera és un camí cap endarrere. Ha rebut veu, ha analitzat l'idioma del que s'ha dit, ho ha entès, ha buscat una resposta i ara ha de fer el contrari. Aplica les regles de l'idioma a la resposta i crea un text apropiat per a parlar.
I finalment, JJ8 ha de sintetitzar la veu per a dir el que està en aquest text. Potser és el més fàcil. La creació de la veu sintètica està en gran manera desenvolupada, tret que es requereixin emocions i un to molt especial.
Per fi! El robot respon. En aquest cas, Fausto li diu a JJ8 que vagi a la cuina. Res més. El robot no necessitava resposta. De tornada a la cuina, havia de buscar allí la sal (saler). Però ha respost i la veritat és que gràcies a la resposta sap el que ha pensat Fausto JJ8.
Fausto no està molt content perquè el robot cuiner no li entén del tot, i això l'obliga a parlar de manera concreta i clara. Però veient el difícil que és crear una conversa artificial, Fausto hauria d'estar satisfet.
Realitat
JJ8 no és real. Neix com a exemple de les dificultats que té capacitar a una màquina per a parlar. Però els seus robots reals alternatius han de superar dificultats similars en funció de les seves aplicacions. Pot ser que no facin els mateixos passos que el robot JJ8 o ho facin en el mateix ordre. Però, en tots els casos, la ciència i la tecnologia que hi ha darrere tenen a veure amb el processament del llenguatge. Les principals dificultats que presenten les màquines expenedores de debò són les de processament del llenguatge humà.
Els investigadors han avançat en aquest camí. No obstant això, els experts coincideixen que encara falta molt perquè les màquines puguin parlar com a persones. La recerca està només en els primers passos, però el treball ja realitzat és sorprenent; d'una banda, la col·laboració entre informàtics i lingüistes ha mostrat les dificultats de la conversa artificial i, per un altre, ha començat a desenvolupar estratègies per a la majoria dels passos. No és poc.
Gai honi buruzko eduki gehiago
Elhuyarrek garatutako teknologia