}

Imágenes en alta definición a alta velocidad

2006/02/01 Imaz Amiano, Eneko - Elhuyar Zientziaren Komunikazioa Iturria: Elhuyar aldizkaria

Afortunadamente o por desgracia, hoy en día vivimos en el mundo de la imagen: anuncios, televisión, cámaras de fotos y vídeo, imágenes de ordenador, cámaras de seguridad… imágenes y cámaras por doquier. Y, por supuesto, la importancia de la imagen y la calidad de la imagen van unidas entre sí, por lo que cada vez necesitamos imágenes de mejor calidad, para lo que se necesitan programas que aporten una mayor calidad y trabajen más rápido.
Imágenes en alta definición a alta velocidad
01/02/2006 | Imaz Amiano, Eneko | Elhuyar Zientzia Komunikazioa
(Foto: ANDÉN)

Cuando se necesitan imágenes en alta definición, hay dos opciones: usar buenas cámaras o tratar imágenes menos buenas por ordenador. Sin embargo, aunque la cámara sea muy buena, la calidad de las imágenes obtenidas puede no ser suficiente.

La primera tendencia de quien no trabaja con imágenes, colocada delante del ordenador, suele ser aumentar la foto, hacer un zoom. Esta técnica es muy limitada, puede aumentar un poco más bien, pero al aumentar dos veces, por ejemplo, la calidad y la resolución disminuyen drásticamente. Por ello, es conveniente utilizar programas especiales para conseguir buenos resultados, tanto en fotos como en vídeos.

Urinarios obligatorios

Las imágenes del ordenador están formadas en realidad por cuadraditos llamados píxeles que crean una matriz. Los pixels contienen información sobre el color e intensidad de esta zona de la imagen. Por lo tanto, cuantos más píxeles, más pequeños serán estos y, por tanto, más información sobre la imagen, con mejor resolución. Y cuanto mayor sea la resolución, más posibilidades de trabajar y ampliar.

Cuando aumentamos una imagen sólo con zoom en el ordenador, los píxeles aumentan pero no se añaden, la cantidad de información es la misma, pero la superficie de la imagen es mayor. Esto hace que la imagen se difumine o pixele. Es más adecuado aumentar el número de píxeles, pero eso sí, a los nuevos píxeles hay que darles una nueva y adecuada información. Si se les asigna la misma información que los píxeles preexistentes, la imagen volverá a difuminar.

Superresolución

Los métodos que incorporan píxeles y nueva información para ellos se denominan métodos de superresolución. Son programas que reconstruyen imágenes en baja definición y mejoran su resolución, y se utilizan en imágenes de satélite, en el tratamiento de imágenes obtenidas a través de telescopios, microscopios, cámaras de seguridad o cámaras infrarrojas, en la recuperación de películas antiguas, en la tecnología digital, etc.

Se hace pasar la imagen en una matriz de píxeles. En cada cuadrado se genera información nueva que se utiliza para aumentar la resolución de la imagen.
SENER

Los sistemas basados en cálculos matemáticos son los métodos de superresolución más utilizados. Estos sistemas o métodos realizan cálculos probabilísticos para saber cómo integrar la nueva información de los píxeles añadidos y con ello crear una nueva imagen.

Los métodos de probabilidad más utilizados son los análisis bayesianos. Los resultados son muy buenos, pero suelen ser bastante lentos: tardan 1 ó 2 minutos en tratar el vídeo de un segundo. Otro método relativamente nuevo. Es un sistema de superseparación basado en redes neuronales que trabaja a 100 o 200 veces más rápido, casi en tiempo real.

No obstante, todos los programas de superresolución, tanto probabilísticos como neuronales, dividen el trabajo en dos fases. En la primera fase se crean nuevos píxeles a los que se les asigna nueva información. Para ello necesitan obligatoriamente fragmentos de vídeo o secuencias de imágenes fijas. En una segunda fase, utilizan esta información para reconstruir la imagen con mejor calidad.

Redes neuronales

Limitado al método de las redes neuronales, en una primera fase, el sistema genera una nueva matriz basada en la red o matriz de píxeles de la imagen de vídeo. Concretamente, genera una matriz de 16 nuevos píxeles por cada píxel original.

A continuación, utiliza el movimiento de los objetos de las imágenes para atribuir información a los nuevos píxeles. El movimiento puede ser el desplazamiento del objeto en sí mismo, desde el fotograma de un vídeo al fotograma o bien en una secuencia fotográfica. Sin embargo, si el objeto está parado, el sistema tiene un movimiento tan pequeño como la vibración de la propia cámara.

Imágenes ampliadas de un buque de pasajeros sin tratar y tratadas con el nuevo método.
SENER

Sin embargo, al mover la imagen, por un lado pasa por los nuevos píxeles, generando información para estos nuevos píxeles. Por otro lado, el movimiento crea nuevos ángulos entre cámara y objeto, que el sistema aprovecha para obtener nueva información: mejora la definición de bordes, colores, tonos, etc. gracias a nuevos ángulos o puntos de vista.

Esta primera fase la realiza el nuevo programa basado en redes neuronales mediante métodos estándar.

En una segunda fase, el programa unifica toda la información y rehace la imagen con mejor resolución. Hasta ahora los sistemas usaban estimaciones matemáticas para unificar la información y calcular la imagen más probable en base a ella, mientras que las redes neuronales no necesitan cálculo, ya que están preformadas.

Los seres vivos como ejemplo

Los programas que trabajan con redes neuronales son sistemas basados en la inteligencia artificial. Las neuronas de estas redes son simples simulaciones de las neuronas de los seres vivos, pero todas ellas agrupadas en una red pueden generar modelos informáticos capaces de realizar tareas de gran complejidad.

La principal característica de este tipo de sistemas es su capacidad de aprendizaje y, en este caso, su formación en el tratamiento de imágenes.

(Foto: SENER)

La formación es muy similar a la que hacemos las personas para muchas cosas. En primer lugar, se introduce al sistema una imagen de buena calidad o resolución, seguida de varios ejemplos en baja resolución de una misma imagen. Con ellas, se hace estorbar al programa una y otra vez de cada imagen deficiente, es decir, se le hace avanzar de la mala a la buena.

El programa ajusta varios parámetros hasta alcanzar el objetivo marcado y memoriza dichos ajustes. Así, al encontrar unos parámetros concretos, sabe qué y cuánto tiene que cambiar.

Se necesitan unas 6 horas para una correcta formación. Ha aprendido cómo tratar imágenes en baja definición y, en adelante, sabe qué y cómo tratarlas en cada caso. Siempre seguirá los mismos pasos: situará la imagen a tratar en la nueva matriz de píxeles y, gracias al movimiento, dotará a los nuevos píxeles de nueva información mediante las técnicas habituales, y posteriormente la red neuronal unificará toda la información y reconstruirá la imagen, basada en las formas de actuación y los ajustes de parámetros que tiene memorizados.

El sistema basado en redes neuronales no requiere cálculo matemático, por lo que puede trabajar en un golpe. Ahí gana tiempo.

Este nuevo sistema de superresolución, desarrollado en la empresa SENER de Getxo, ya está en el mercado. Sin embargo, no creemos que sea fácil de conseguir. Y es que, a pesar de que en los ejemplos aparecen un coche y un ferry, sobre todo se han dirigido al mercado de tratamiento de imágenes grabadas por satélite, según nos ha informado el responsable del proyecto, Carlos Miravet.

Formación
Imaz Amiano, Eneko
Servicios
217
2006
Servicios
041
Física; Química; Matemáticas