EQUIPO DE INVESTIGACIÓN
Investigadores principales: Marcelo Bertalmío (Instituto de Óptica, CSIC, Madrid); Jesús Malo López (Departamento de Óptica, Facultad de Física, Universitat de València); Felix Wichmann (Departamento de Ciencias de la Computación, Grupo de Procesamiento de Información Neuronal, Universidad de Tubinga, Alemania)
Miembros del equipo: Raúl Luna (Instituto de Óptica, CSIC), Javier de la Portilla Muelas (Instituto de Óptica, CSIC), Ilias Rentzeperis (Instituto de Óptica, CSIC)
DESCRIPCIÓN
En las últimas décadas, se han logrado avances espectaculares en el campo de la visión artificial, tal y como refleja el desarrollo de vehículos capaces de conducir de forma autónoma o de robots en los que ya se apoyan los cirujanos para realizar complejas operaciones quirúrgicas. Sin embargo, la realidad es que los actuales sistemas de visión artificial –basados en las llamadas redes neuronales que son entrenadas para hallar patrones en grandes bases de datos– todavía padecen algunas limitaciones severas.
Por ejemplo, con bastante frecuencia cometen errores en los que normalmente nunca caería un ser humano: “Les enseñas una silla y son capaces de identificarla como tal, pero en cuanto les enseñas la misma imagen rotando levemente el objeto, de repente la confunden con un elefante”, explica Felix Wichmann, líder del Grupo de Procesamiento de Información Neuronal en el Departamento de Ciencias de la Computación de la Universidad de Tubinga (Alemania).
Al mismo tiempo, las redes neuronales cometen fallos graves cuando una imagen cambia tan levemente que es imperceptible a ojos de un ser humano –una pequeña variación en unos pocos píxeles–, pero que pueden llevar al sistema de visión artificial a confundir un plátano con un cocodrilo. Este tipo de errores pueden llevar a riesgos críticos para la seguridad de los usuarios en contextos como los de la conducción de un coche autónomo, al que se le puede engañar fácilmente: basta colocar una pegatina en una señal de Stop para que sea incapaz de interpretar adecuadamente lo que tiene que hacer. El objetivo del proyecto de investigación seleccionado es intentar superar estos fallos de la visión artificial.
“Las redes neuronales necesitan muchos más datos para adquirir el mismo nivel de competencia visual que un ser humano, e incluso que un pato o un insecto”, señala Marcelo Bertalmío, Investigador Científico del Instituto de Óptica, CSIC. Estas limitaciones, según los investigadores principales del proyecto, se deben a que los actuales sistemas de visión artificial están basados en una neurociencia anticuada, con enfoques de los años 70 y 80 del siglo pasado.
“En realidad, el cerebro humano es mucho más complejo, tal y como han demostrado los avances en la neurociencia de las últimas décadas”, apunta Wichmann. “Por ello, lo que proponemos en este proyecto es transformar el funcionamiento de las redes neuronales en base a lo que ahora conocemos sobre la complejidad del nuestro cerebro”.
Según explica Jesús Malo, catedrático de Optometría y Ciencias de la Visión en la Universitat de València, una habilidad fundamental que posee el sistema visual humano es lo que los especialistas en este campo denominan “adaptación”, es decir, “la capacidad para interpretar nuevos datos que no ha visto previamente de manera adecuada”. Gracias a esta habilidad para generalizar y clasificar percepciones visuales en base a experiencias previas, “si rotamos una silla, no caemos en el error absurdo de confundir este objeto con un elefante”. El problema de los actuales sistemas de visión artificial, resalta Malo, es que se basan en modelos “demasiado simplistas” de las neuronas visuales.
Por ello, a través de la cooperación multidisciplinar de un equipo de investigadores expertos en óptica, neurociencia, computación e inteligencia artificial, este proyecto pretende desarrollar modelos que se aproximen mucho más al funcionamiento biológico de las neuronas en un cerebro humano. De esta manera, esperan poder diseñar sistemas mucho más sofisticados, seguros y eficientes, que puedan aplicarse no solo al campo de la visión robótica, sino a otros campos de inteligencia artificial, como la interpretación y generación de textos.