Itzulpen automatikoan genero-alborapena zuzentzeko teknika berritzaile bat sortu dute
2022/12/19 Elhuyar Iturria: Elhuyar aldizkaria
Itzulpen automatikoan genero-alborapena zuzentzeko teknika berritzaile bat sortu dute Oraiko ikertzaileek. Ikerketa honen emaitza oso baliagarria izango da itzultzaile automatikoek duten arazo hori zuzentzeko; bereziki, generorik gabeko hizkuntzetatik itzultzeko aukera ematen duten itzultzaile automatikoen kasurako.
Genero-alborapena arazo ezaguna da adimen artifizialaren alorrean. Algoritmo gehienek adibideetatik ikasten dutenez, sarrerako adibideetan dauden alborapen eta estereotipo sozialak ere ikasten dituzte. Hortaz, algoritmo horiekin ikasten duten sistemek alborapen hori errepikatzeko joera dute.
Itzulpen automatikoko sistema neuronalek ere arazo hori dute, eta entrenamendu- adibideetan ageri den genero-alborapena itzulpenetara eramaten dute. Adibidez:
Nire ama errementaria da. ⇒ Mi madre es herrero.
Nire aita erizaina da. ⇒ Mi padre es enfermera.
Itzulpen automatikoko sistemen erabilera masiboa dela eta, halako genero-alborapenak iraunarazteko eta areagotzeko arriskua dago. Genero-alborapenaren arazoa kudeatzea ez da erraza, eta are gutxiago itzulpena generorik gabeko hizkuntza batetik egiten denean, hala nola euskaratik. Oraik, hain zuzen ere, generorik gabeko hizkuntzentzat baliagarria den teknika berritzaile bat ikertu eta garatu du.
Proposatutako teknikak bi metodo uztartzen ditu: “Alborapena duen sistema neuronalak adibide orekatuetatik ikasiz alborapen hori zuzentzeko metodo bat, eta sistema neuronalari generorik gabeko hizkuntzan genero-informazioa modu esplizituan txertatzeko metodo bat”, adierazi du Oraiko ikertzaile Ander Corral Navesek.
Halaber, “sortutako teknika konputazionalki arina da, eta ez da konplexua produkzioan dauden sistemetan txertatzea” gehitu du Oraiko NLP Teknologietako arduradun Xabier Saraleg Urizarrek. “Pauso garrantzitsua da: teknika honi esker, genero- alborapenik gabeko itzulpen automatikotik hurbilago gaude”.
Lan hau itzulpen Itzulpen Automatikoko Zazpigarren Konferentzian (Seventh Conference on Machine Translation - WMT22) aurkeztu dute.
Gai honi buruzko eduki gehiago
Elhuyarrek garatutako teknologia