Bota galdera!
2014/04/01 Lopez-Gazpio, Iñigo - EHUko IXA Taldeko ikertzailea Iturria: Elhuyar aldizkaria
Gogoan al duzue txikitan irakasleak gai bat amaitzean "ea, bota itzazue galderak!" esaten zuenean? Une hartan bertan hasten zen ezkutaketa-jolasa: aurreko ikaskidearen sorbalda atzean, mahai azpian, ikasgelako atearen atzealdean... edozein ihes-mugimendu baliozkoa zitzaigun irakaslearen begiradarekin topo ez egiteko. Lotsati horiei guztiei berri on bat dakarkiegu, gaurtik aurrera konputagailuak jasango baititu muxu-gorriak gure ordez.
Ondorengo lerroetan, corpus bat oinarri hartuta esaldi-mailan galderak automatikoki eta masiboki sortuko dituen sistemaren hastapenak azalduko ditugu (sistema hauek QG (Question Generator) izenez ezagutzen dira). Horretarako, sukaldaritzan jaki goxo bat prestatzeko egiten dugun antzera, galdera-sorkuntzan ere beharrezkoa izango da pauso zehatz batzuei jarraitzea. Izan ere, galderak automatikoki sortzeko eta, adibidez, pizza bat egiteko jarraitu beharreko urratsak oso parekoak dira. Kontu hori guztia martxan jartzeko jarraituko dugun prozesuak lau urrats ditu, sekuentzialki jarraitu beharrekoak:
1. Sarrera-corpusa prozesatzea
Lehen urratsa, sarrera-corpusa prozesatzea --linguistikoki analizatzea-- helburu duena. Hortaz, bada, atal honetan, sarrera-corpusetik abiatuta ahalik eta informazio gehiena lortzen ahaleginduko gara. Informazio-bilaketa hori hizkuntzaren prozesamenduko hainbat eremutan errepikatzen bada ere, funtsezko ataza da zentzuz aurrera jarraitu nahi badugu behintzat. Atal honi gogoz ekiteko, beharrezkoa izango dugu hizkuntza-baliabide desberdinak erabiltzea, hala nola analizatzaile sintaktikoak, analizatzaile morfologikoak, analizatzaile semantikoak, lematizatzaileak, tokenizatzaileak... Hala, jatorrizko esaldietan aditzak --jokatuak eta jokatu gabeak--, izenak, izenondoak, aditzondoak... identifikatzeko gai izango gara, eta, horrez gain, hitzak eta horiek osatzen dituzten izen-sintagmak, izen-sintagmen deklinabide-kasuak, aditzen arteko sintagma-konposaketak --aditz sinpleak, konposatuak, laguntzaileak... --eta esaldietako hitzen dependentzia sintaktikoak ere identifikatu beharko ditugu.
Sukaldaritzan aritzen garenean ere, konturatu gabe, hasieratze horren antzeko analisi bat egiten dugu: informazioa eta lanabesak prestatzen ditugu. Lehendabizi, jakia prestatzeko behar dugun eskuliburua hartzen dugu; ondoren, zer osagai behar ditugun irakurtzen dugu, haiek zerrendatu eta bilatzen ditugu; eta, gero, behar ditugun lanabesak sukaldeko mahaiaren gainean kokatzen ditugu, errezetaren pausoak trabarik gabe egiteko.
2. Galderen emaitzak hautatzea
Behin errezetako jakiak zerrendatu ditugunean --hobe gure hozkailuan egotea dendan baino!--, haien bila joatea da hurrengo urratsa. Tomatea eta urdaiazpikoa hozkailuan, gazta sukaldeko mahai gainean, ura iturrian, irina apalean, gatza armairuan... ; dena den, aitonaren baratzeko tomateak erabili ordez , aurreko eguneko tomate-saltsa erabiliko dugu, oso goxoa baitzegoen, eta, ziur, primeran geratuko dela.
Garatzen ari garen galdera-sortzailearen bigarren pauso honetan, sukaldean egin dugun modura, galderen emaitza egokienen bila joatea da helburua . Atal honetan ere, nahitaezkoa da hizkuntzaren prozesamendu naturaleko baliabideak erabiltzea, aurretik sailkatu ditugun osagaien artean hoberenak hautatu behar baititugu. Hautaketa hori egiteko, informazio-iturri desberdinak erabili daitezke, esaterako: sare semantikoak; bizidunen eta bizigabeen hiztegiak edota artikuluen, albisteen, erakundeen, pertsonaia ospetsuen ... datu-baseak. Hala, hitz eta sintagma guztien artean, informazio gehien ematen digutenak aukeratuko ditugu, eta, ondorioz, sortuko ditugun galderak interesgarriak izateko aukera gehiago izango dituzte.
3. Galdetzaileak aukeratzea
Gutxi falta da amaitzeko, labea berotzen hasi eta dagoeneko prestatzen ari garen jakia usaintzeko gai gara. Osagaiak mahai gainean ditugu, beharko ditugun tresnak ere bai. Hortaz, eskuak zikintzeko garaia heldu zaigu, osagai bakoitza prestatu beharko baitugu: irin-orea osatu, gazta zuritu eta arraspatu, tomateari haziak kendu, urdaiazpikoari plastikozko banatzekoak kendu...
Orobat, galderak sortzeko jarraitzen ari garen prozesuan egin beharreko lanak antzekoak dira. Izan ere, corpusa analizatu eta galderen emaitzak identifikatu ditugu; hortaz, aurrera jarraitzeko, eskuak zikindu beharko ditugu, birtualki bada ere, sortuko ditugun galdera-motak prestatu behar baitira. Galdera-mota --eta horrekin batera, galdetzailea-- aukeratzea aurreko faseetan egindako lanarekin lotuta dagoen ataza da. Hala, sarrera-corpusean datak identifikatzea lortu badugu, zentzuzkoa litzateke denbora-motako galdera bat sortzea, "noiz" --edo tankera horretako-- galdetzaile bat erabiliz horretarako. Aitzitik, pertsonaia ospetsuak identifikatzea lortu badugu, zentzuzkoa litzateke pertsonaia bati loturiko galdera bat osatzea, eta "nor" galdetzailea erabiltzea kasu horretan. Azaldu den gisa lan egingo dugu, aurreko fasean identifikatutako hautagai guztientzat galdera-mota zehaztu dugun arte.
4. Galderak eraikitzea
Dena prest dugu, azken txanpa bakarrik geratzen da, hots, egindako lan guztia bateratzea ; hala eta guztiz ere, kontuz ibili behar dugu, azken uneko akats batek egindako lan guztia honda baitezake. Prestatu ditugun osagai guztiak errepasatu ondoren, lanari ekiten diogu: pizza ren orearen gainean tomatea zabaldu, gazta eta urdaiazpikoa gainetik sakabanatu, eta, azkenik, jakia labean sartu. Orain, hogei bat minutu itxaron besterik ez dugu egin behar; bitartean, platerak, mahai-tresnak eta edalontziak prestatu baino ez dugu egin behar, labeko alarmak jakia ateratzeko ordua heldu dela ohartarazten digun arte.
Galdera-sortzailearen sistemaren azken urratsean ere, pareko lanak egin beharko ditugu. Hau da, jatorrizko esaldia hartu eta patroi zein erregela batzuetan oinarrituz galdera eraiki behar baitugu. Horrez gain, beste hainbat moldaketa ere egin beharko dira, esaterako, loturazko lokailuak ezabatu, puntuazio-markak egokitu, aditzen kasuak eta markak egokitu...; baina ez hori bakarrik, bururatzen zaizkigun beste hainbat gauza ere egin daitezke, galderak hobetzea helburu duen lan oro ongi etorria izango baita, hala nola anaforak ebaztea eta galderekin zerikusirik ez duen informazioa baztertzea --esaldiak laburtzea, alegia--.
Ondorioak
Ikusi duzuenez, galderak masiboki sortzen dituen sistema martxan jartzeko, lau urrats egin behar dira: sarrera-corpusa prozesatu, galderen emaitzak hautatu, galdetzaileak aukeratu eta, azkenik, galderak eraiki. Pizza bat egitea bezain erraza!
Garatu dugun sistema galdera-sortzailea --oso oinarrizko QG sistema dena-- eta ariketak automatikoki sortzeko gai diren beste hainbat sistema irakaskuntza-ikaskuntza arloarekin erabat loturik dauden baliabideak dira, irakasleek materiala prestatzeko behar duten denbora nabarmen murrizten baitute. Oro har, ariketak sortzeko sistema automatikoak e-learning plataforma handiagoetan integratuta egoten dira, eta, hala, lan-karga txiki baten ordainetan parte hartzen duten eta, aldi berean, ikasten dabiltzan erabiltzaile mordoa izateko aukera ematen dute.
Amaitzeko, hasieran aipatutako lotsati guzti horiei, jada badakizue zuen lotsak pizza bat egitea bezain erraz desager daitezkeela (hogei minutu baino denbora gehixeago beharko baduzue ere); beraz, atera zaitezte zuen ezkutalekuetatik, eta bota itzazue galderak !
Bibliografia
Gai honi buruzko eduki gehiago
Elhuyarrek garatutako teknologia