AnHitz, zientzia-aditu birtuala
2009/01/01 Kortabitarte Egiguren, Irati - Elhuyar Zientzia Iturria: Elhuyar aldizkaria
2006tik 2008ra garatu den AnHitz proiektuaren emaitza da azaroaren erdialdean aurkeztu zuten AnHitz demoa edo prototipoa. AnHitz pertsonaia birtual bat da, zientzia-kontuetan aditua, gainera. Euskaraz hitz egiten du. Egiten zaizkion galderak ulertzeko gauza da, eta galderei erantzuteko ere bai. Hortaz, pertsonaia birtual interaktiboa da, zientzian aditua eta euskalduna.
Erabiltzaileak zientzia eta teknologiari buruzko galderak (Nork asmatu zuen teleskopioa?, Noiz aurkitu zuten penizilina?, Non jaio zen Newton?...) egin diezazkioke sistemari, euskaraz. Era berean, sistemak euskaraz ematen ditu erantzunak. Galderei erantzuteaz gain, hitz bakar edo anitzeko kontsulta bat egiten bazaio, gai da kontsulta horri dagozkion dokumentuak bilatzeko.
Hitz bakar edo anitzeko kontsultak ere euskaraz egiten zaizkio (ozono-geruza, esnea edateko gaitasuna eboluzioan, energia-iturri berriztagarrien alde onak eta txarrak...), baina kontsulta horiekin zerikusia duten gaztelaniazko eta ingelesezko dokumentuak ere bilatzen ditu, euskarazkoez gain. Gaztelaniazkoak automatikoki itzultzen ditu euskarara sistemak, eta ingelesezkoak jatorrizko hizkuntzan ematen ditu oraingoz, baina laster horiek ere itzuliko ditu euskarara.
Zeregin hori betetzeko, Interneteko zientzia eta teknologiako hainbat gunetan egiten du bilaketa. Gainera, nahi izanez gero, testu horiek irakurri egiten ditu sistemak, hiru hizkuntza horietako edozeinetan. Horrez gainera, testuen izenburuan klik eginez gero, haien jatorrizko web gunera sar daiteke erabiltzailea, eta automatikoki itzulitakora ere bai, hala nahi badu. Hori guztia lortzeko, jakina, beharrezkoa da teknologia bat baino gehiago uztartzea.
Hamaika teknologia
Aita eta ama bat baino gehiago ditu AnHitz-ek. Izan ere, hainbat enpresak elkarlanean egin duten proiektu baten alaba da. Itxura VICOMTech-IK4 ikerketa-zentroak eman dio, avatarrak edo pertsonaia birtualak sortzeko duen teknologiaz baliatuta. Kasu honetan, emakumezko-itxurako pertsonaia birtual bat garatu du. Aipatzekoa da hiru dimentsiokoa dela, eta emozioak adieraz ditzakeela. Pertsona errealaren antza izateak komunikazioa errazten du.
EHUko Aholab taldeak eta Robotiker-Tecnalia ikerketa-zentroak, berriz, ahotsaren ezagutzan eta sintesian trebatu dute. Horri esker, AnHitz gai da euskalkiak eta hitzak ahoskatzeko hainbat aldaera ezagutzeko, berak euskara batuan hitz egiten badu ere. Galderei erantzuteko sistema eta Interneteko dokumentuak euskarara modu automatikoan itzultzeko gaitasuna EHUko IXA taldeari zor dizkio. Azkenik, dokumentu eleaniztunak bilatzeko abilezia Elhuyar Fundazioaren I+G taldeak egindako lanaren ondorio da.
Proiektu zabal honetan, erakunde horiek zazpi baliabide, hamahiru tresna eta zazpi aplikazio garatu edo hobetu dituzte euskararen alorrean. Eusko Jaurlaritzaren ETORTEK ikerketa-programaren diru-laguntza jaso du.
Gainera, proiektu honetan, lehenengo aldiz, euskararen alorrean dauden hainbat erreminta aplikazio bakarrean bildu dituzte. Hain zuzen, teknologia hauek uztartu dituzte: Question Answering (galderak erantzutea), Cross Lingual Information Retrieval (informazio-bilaketa eleaniztuna), Machine Translation (itzulpen automatikoa), Speech Synthesis (ahotsaren sintesia), Automatic speech Recognition (ahotsaren ezagutza) eta Visual Interface (ikus-interfazeak). Teknologia horien guztien integrazioaren ahalmena ikusteko, demo bat garatu dute; AnHitz, hain zuzen ere.
"AnHitz proiektuan erabilitako hizkuntza-teknologia ahalik eta gehienak elkarlanean aritzeko aukera emango digun sistema batean oinarrituta dago demoa" dio Igor Leturia Elhuyar Fundazioko I+G taldeko kideak eta demoaren arduradunak. Demo horren bidez, erabiltzaileak eta makinak elkarrizketa bat izan dezakete.
Zientziaren, Teknologiaren eta Berrikuntzaren Asteko Donostiako eta Bilboko zientzia-karpetan AnHitz gertutik ezagutzeko aukera izan zuten herritarrek. Haur, gazte nahiz helduek egindako makina bat galdera eta kontsulta jaso zituen AnHitzek. "Harrera oso ona izan du, eta zenbaitetan jendearengan, haurrengan batez ere, harridura ere sortu duela esan liteke" gehitu du Leturiak. "Oro har, helduek kontu handiz eta hitzak neurtuta egiten zizkioten galderak AnHitzi, horren guztiaren atzean egon litekeen teknologia guztiaz jabetuta, nolabait esateko; haurrek, berriz, beren ezjakintasunean, naturaltasun osoz egiten zizkioten galderak, galdera-mota guztiak" gehitu du.
Nolanahi ere, AnHitz prototipo bat da. "Oraingoz, zientzia- eta teknologia-gaietan baino ez da aditua, eta ez die galdera-mota guztiei erantzuten: nork, nor, noiz edo non galdetzaileekin egindako galderei erantzuten die ondoen" azpimarratu du Leturiak. "Hala ere, zalantzarik gabe, hainbat bide berri irekitzen dizkigu honek. Izan ere, litekeena da etorkizunean beste zenbait ezagutza-eremutan ere, turismo-bulegoetan esaterako, aplikatu ahal izatea, bilaketak beste ezagutza-base batzuetan eginez, noski. Halaber, AnHitz-en atzean dagoen teknologia guztia hobetzen jarraituko dugu, eta pertsonen eta gailuen arteko komunikazioa errazten jarraituko dugu" dio Leturiak.
Hain zuzen ere, horixe da AnHitz proiektuaren helburua: pertsonak eta gailuak elkarrekintzan aritzeko behar diren euskarazko hizkuntza-teknologiak ikertzea eta garatzea, eta ezagutzak modu naturalean, intuitiboan eta atseginean kudeatzea. Komunikazio-maila ona eta atsegina lortzeko, hizkuntzaren erabilera komunikazioaren alor guztietan sartu behar da: ahotsean, testuan eta baita multimedia-materialetan ere. AnHitz pertsonaia birtuala horren erakusgarri txiki bat besterik ez da.
Gai honi buruzko eduki gehiago
Elhuyarrek garatutako teknologia