Una màquina que et coneix a la cara
2011/03/19 Lakar Iraizoz, Oihane - Elhuyar Zientzia
Els éssers humans tenim prop de 100 mil milions de neurones en el cervell. Entrellaçats formen una àmplia xarxa. Gràcies al treball de les neurones podem assimilar i comprendre el que percebem al nostre al voltant i a partir d'aquesta informació anem acumulant coneixement. De fet, totes les coses que aprenem queden atrapades en la xarxa neuronal.
Ibermatica ha desenvolupat en Zamudio un sistema que imita la manera d'actuar del nostre cervell per a desenvolupar diferents aplicacions. El sistema compta amb xarxes neuronals artificials que bàsicament organitzen el món que ensenyen al sistema, "com nosaltres organitzem per a diferenciar fanals, animals i arbres que veiem en la muntanya o al carrer", explica Aitor Moreno.
Ibermatica està desenvolupant aquest sistema per a aplicacions concretes. En un dels usos es pretén que el sistema se situï en l'entrada dels edificis per a permetre l'accés exclusiu de les persones registrades. El sistema ha de conèixer les cares de les persones autoritzades, obrint automàticament la barrera a les persones conegudes.
El nucli del sistema, l'ensenyament
Com es pot aconseguir que una màquina sigui capaç de veure una cara i conèixer-la ràpidament? El primer pas és ensenyar al sistema qui són les persones perquè processi la informació de cadascuna d'elles. "A través de diverses fotos de la persona que volem registrar", explica Maitane Garmendia, d'Ibermatica.
En passar les fotos a l'ordinador, el sistema converteix els colors en gris, és a dir, canvia a blanc i negre. A continuació introdueix cada foto en una matriu de 64 x 64 cuadraditos en la qual s'emmagatzema la informació de cada foto. D'alguna manera converteix la fotografia en un gran quadrat de 64 x 64 cuadraditos.
Inclouen diverses fotos de cada persona en el sistema i repeteixen el procés amb cadascuna d'elles. "Així aconseguim formar el sistema", diu Garmendia. Les fotografies han estat preses en diferents posicions perquè el sistema interioritzi les principals característiques d'aquesta persona. "Això és possible gràcies a l'estructuració de la xarxa en la qual es basa", explica Moreno.
A mesura que va introduint les fotos, va aprenent el sistema. També comet errors. Amb el que ha après, quan rep una imatge, la classifica i si no encerta es crea un error. Sobre aquest error han de tornar a dir-li quina és la bona classificació, i així, "formem a poc a poc", diu Garmendia. Quants més intents hi hagi, més errors cometrà el sistema i, gràcies a la correcció, cada vegada coneixerà millor els elements que li arriben.
Cada vegada que es mostra una nova foto, la compara amb les fotos que té acumulades. Si s'assegura la similitud en un percentatge alt entre les característiques de dues fotografies, permetrà al treballador avançar. En cas contrari, no permetrà l'accés a l'edifici.
Més que controlar l'accés
A més de permetre el pas de les persones, aquest sistema desenvolupat en Ibermatica pot ser utilitzat per a moltes altres coses. Per exemple, per a evitar el frau en els supermercats. A l'hora de passar per caixa, es pot utilitzar per a controlar que es cobra el producte real i evitar, per exemple, substituir l'etiqueta d'un producte més barat per una etiqueta més cara. Els cobradors normalment no disposen de temps per a verificar-los i poden tenir un sistema auxiliar de neurones artificials. El sistema, mitjançant una cambra en caixa, detecta l'aparença del producte i comprova si l'etiqueta que té col·locada és la que li correspon. El sistema aprèn l'aspecte exterior dels paquets i continguts, evitant així el frau.
Totes aquestes aplicacions poden estar presents en el sistema degut a l'entrada repetida d'imatges. La inclusió de moltes fotografies d'una persona o producte concret permetrà associar-les de forma més fiable i amb major confiança al que el sistema ha d'identificar les principals característiques que percep.
Com tot, només cal repetir aquesta formació fins a un punt. I és que "si es fiquen més fotos de les necessàries, el sistema deixa d'inferir i aprèn", explica Garmendia. Per exemple, si al sistema se li diu moltes vegades que una persona és aquesta persona, i si aquesta persona deixa estirar la barba un dia, per exemple, el sistema no el reconeixerà. I és que, mentre no trobi la imatge exacta d'aquesta persona, no decidirà que és aquesta persona.
Publicat en Ortzadar
Gai honi buruzko eduki gehiago
Elhuyarrek garatutako teknologia