[ Back to EurekAlert! ] Public release date: 15-Feb-2013
[ | E-mail Share Share ]

Contact: Oihane Lakar Iraizoz
o.lakar@elhuyar.com
34-943-363-040
Elhuyar Fundazioa

Un investigador de la UPNA desarrolla nuevos algoritmos de reconstrucción 3D menos complejos y más precisos

Este comunicado está disponible en inglés.

Leonardo de Maeztu Reinares ha propuesto en su tesis doctoral algoritmos de reconstrucción 3D que, igualando los resultados de las mejores técnicas existentes, puedan ser ejecutados de manera más ágil en un ordenador. Su trabajo se basa en la visión estereoscópica, una técnica para obtener imágenes tridimensionales y que requiere, para poder producir resultados precisos, una fuerte carga computacional y gran complejidad algorítmica. Sus investigaciones han sido publicadas en revistas internacionales, entre otras en IEEE Transactions on Pattern Analysis and Machine Intelligence.

"El principio básico de la estereoscopía es el uso de dos o más cámaras que adquieren simultáneamente la misma escena desde diferentes posiciones, a semejanza de los ojos humanos —explica este investigador—. De esta manera, para cada instante de tiempo, se captan dos o más imágenes, que son comparadas entre sí para deducir la distancia de los objetos a las cámaras y captar así la profundidad de la que carece la fotografía clásica, que es bidimensional". Esta disponibilidad de dos perspectivas bidimensionales permite la reconstrucción tridimensional de la escena utilizando algoritmos de búsqueda de correspondencias entre imágenes.

Gracias al continuo incremento de la capacidad de cálculo de los ordenadores, cada vez es más habitual su uso para tareas de vigilancia, medición o inspección hasta hace poco reservadas a los seres humanos. Con tan solo una cámara fotográfica o de vídeo, los PC actuales pueden utilizarse para vigilancia de grandes multitudes, inspección de piezas al final de una cadena de producción o registro de matrículas de vehículos que atraviesan una zona. El problema es que utilizar una sola cámara limita la capacidad de estos sistemas, ya que obtienen una representación bidimensional de un mundo tridimensional. Para resolverlo, existen los sensores tridimensionales; uno de los más utilizados, por su similitud con el sistema visual humano, incluye dos cámaras que graban la misma escena desde dos puntos de vista ligeramente separados.

"Durante los años 70 y 80 del siglo pasado —indica Leonardo de Maeztu— muchos científicos pensaron en imitar la manera en que nuestro cerebro obtiene reconstrucciones tridimensionales a partir de las imágenes suministradas por cada ojo. Sin embargo, rápidamente se hicieron evidentes las diferencias entre nuestro cerebro y los ordenadores. Por esa razón, cada vez fueron cobrando más importancia soluciones adaptadas al funcionamiento de los ordenadores".

Investigación novedosa

La tesis doctoral de este investigador se ha centrado en el desarrollo de algoritmos de reconstrucción 3D que puedan ser ejecutados de manera ágil por un ordenador. Junto a la propuesta de nuevas soluciones más simples que las existentes, ha trabajado de manera intensiva con ordenadores de reciente aparición en el mercado, que gracias a que incluyen nuevos tipos de procesadores permiten agilizar la ejecución de tareas complejas. "Uno de los algoritmos propuestos —explica— obtiene unos resultados mejores que otros previos de su misma clase y, además, presenta una ventaja competitiva muy interesante: ser implementado en tiempo real en una tarjeta gráfica estándar. Aunque son algoritmos que requieren una gran capacidad de cálculo, si se utiliza toda la potencia de los actuales procesadores gráficos, se pueden llegar a ejecutar en tiempo real, es decir, a procesar tantas imágenes por segundo como las que captura la correspondiente cámara".

Al tratarse de una línea de investigación novedosa, llevó a cabo un trabajo de documentación intensivo durante los dos primeros años de tesis. Además, realizó una estancia de cuatro meses en Bolonia (Italia) dirigida por el profesor Stefano Mattoccia, investigador de referencia en el campo de la visión estéreo, con quien ha seguido colaborando hasta la finalización de la tesis.

De Maeztu ha obtenido la calificación apto cum laude con mención internacional por su tesis titulada Towards accurate and real-time local stereo correspondence algorithms: computational efficiency and massively parallel architectures. Como resultado de la misma, se han publicado ocho artículos y comunicaciones en revistas y conferencias internacionales. Cabe destacar una publicación en la revista más importante del área, IEEE Transactions on Pattern Analysis and Machine Intelligence, y una comunicación en una de las dos conferencias más importantes del área, IEEE International Conference on Computer Vision.

###

Referencias:

L. De-Maeztu, A. Villanueva, and R. Cabeza (2012). Near real-time stereo matching using geodesic diffusion. IEEE Transactions on Pattern Analysis and Machine Intelligence 34(2): 410-416.

L. De-Maeztu, S. Mattoccia, A. Villanueva, and R. Cabeza. "Linear stereo matching" International Conference on Computer Vision (ICCV 2011) November 6-13, 2011, Barcelona, Spain.



[ Back to EurekAlert! ] [ | E-mail Share Share ]

 


AAAS and EurekAlert! are not responsible for the accuracy of news releases posted to EurekAlert! by contributing institutions or for the use of any information through the EurekAlert! system.