Crean unha nova técnica para corrixir o rumbo de xénero na tradución automática
2022/12/19 Elhuyar Iturria: Elhuyar aldizkaria
Os investigadores de Orio crearon unha nova técnica para corrixir o rumbo de xénero na tradución automática. O resultado desta investigación será de gran utilidade para corrixir o problema que teñen os tradutores automáticos, en especial os tradutores automáticos que permiten traducir de linguas sen xénero.
O rumbo de xénero é un problema coñecido no ámbito da intelixencia artificial. Como a maioría dos algoritmos aprenden dos exemplos, tamén aprenden os rumbos e estereotipos sociais presentes nos exemplos introdutorios. Por tanto, os sistemas que aprenden con estes algoritmos tenden a repetir este rumbo.
Os sistemas neuronais de tradución automática tamén teñen este problema e levan ás traducións o rumbo de xénero que aparece nos exemplos de adestramento. Por exemplo:
A miña nai é ferreira. A miña nai é ferreiro.
O meu pai é enfermeira. Nire aita é enfermeira.
O uso masivo de sistemas de tradución automática leva o risco de manter e incrementar este tipo de rumbos de xénero. A xestión do problema do rumbo de xénero non é fácil, e moito menos cando a tradución se realiza desde unha lingua sen xénero, como o eúscaro. Orai investigou e desenvolvido unha técnica innovadora para linguas sen xénero.
A técnica proposta combina dous métodos: “Aprendendo sistemas neuronais con rumbo desde exemplos equilibrados, un método para corrixir este rumbo e un método para incorporar de forma explícita a información de xénero ao sistema neuronal nunha lingua sen xénero”, sinalou o investigador de Orai, Ander Curral Naves.
Así mesmo, “a técnica creada é computacionalmente áxil e non é complexa a súa integración en sistemas en produción”, engadiu o responsable de NLP Tecnoloxías de Orai, Xabier Saravia Urizar. “É un paso importante: grazas a esta técnica estamos máis preto da tradución automática sen rumbos de xénero”.
Este traballo foi presentado na Sétima Conferencia de Tradución Automática (Seventh Conference on Machine Translation - WMT22).
Gai honi buruzko eduki gehiago
Elhuyarrek garatutako teknologia