Cordelia Schmid, pionera en reconocimiento de visión artificial, dará un nuevo impulso a su trabajo en el campo de la percepción y la interpretación multimedia, o de la robótica guiada por visión.

Cordelia Schmid lleva 25 años trabajando para avanzar en la visión artificial y el reconocimiento de objetos. Su principal contribución en este campo le ha valido el Körber European Science Prize. Este alto honor permitirá a la investigadora dar un nuevo impulso a su trabajo, por ejemplo, en el campo de la percepción y la interpretación multimedia, o de la robótica guiada por visión.

De la Matemática a la Informática: 25 años de carrera recompensados

Este distinguido y singular Kórber European Science Prize se otorga cada año a un solo científico europeo. Además de su carácter honorífico, el premio está dotado con un millón de euros para futuras investigaciones. Cordelia Schmid es la afortunada ganadora de 2023. “¡Obviamente, es una gran noticia!”, afirma Cordelia, directora de investigación del equio conjunto del proyecto Willow (ENS-PNL, CNRS, Inria). “Este es un premio muy selecto y un paso adelante respecto a todo lo que me han concedido hasta ahora”.

De hecho, este no es el primer premio de la científica: en una carrera que abarca 25 años, se ha forjado una reputación como una de las pioneras de la visión artificial.

Realmente amaba las matemáticas en la escuela”, recuerda. “Quería permanecer en este campo y finalmente pasé de las matemáticas aplicadas a la informática”.

Un camino inspirador desde la visión robótica – robótica guiada por visión – al reconocimiento de objetos

Durante su maestría en la Universidad de Karlsruhe (Alemania), obtenida en 1992, su proyecto fin de estudios estuvo dedicado a la visión robótica o robótica guiada por visión.

Esto me impulsó a continuar mi investigación sobre el reconocimiento de objetos”, nos cuenta. “¡No funcionó en absoluto en ese momento! Era realmente difícil para una computadora detectar un cubo simple, que es una tarea básica para un humano. Esto me impulsó a explorar más cuestión”.

Luego completó una tesis en el Instituto Nacional Politécnico de Grenoble, sobre el tema ‘Image matching and retrieval base don local greyvalue invariants’. Su trabajo supuso una importante contribución al sector. “Este fue el primer estudio que utilizó valores de gris para permitir que los algoritmos identificaran objetos en imágenes y los resultados fueron muy positivos”, explica Cordelia Schmid.

Tras un postdoctorado de un año en la Oxford University, la investigadora se incorporó al INRIA en 1997. Desde entonces, ha permanecido en el Instituto, manteniéndose fiel a sus temas de investigación favoritos.

«En el campo de la visión por ordenador hay toda una vertiente teórica con el desarrollo de algoritmos y modelos, pero también hay una vertiente práctica con la validación directa de los programas que creamos. Me gusta esta mezcla de aspectos de investigación«.

Percepción, interpretación y robótica, con un enfoque multimedia

Actualmente miembro del equipo del proyecto Willow (ENS-PNL, CNRS, Inria), se centra específicamente en el reconocimiento de objetos y acciones en vídeos. Con un enfoque multimedia. ¿Y en términos prácticos? Espera crear programas capaces de utilizar el texto descriptivo de un vídeo, o simplemente su audio, para aprender a reconocer los objetos del vídeo de forma autónoma. En otras palabras, avanzar en el ‘aprendizaje no supervisado’.

En lugar de proporcionar un algoritmo con grandes cantidades de imágenes anotadas manualmente para ayudarle a aprender a reconocer un objeto, le enseñamos a aprender de forma autónoma a partir del texto del vídeo o del audio”, explica Cordelia Schmid.

La investigadora ha regresado recientemente a su campo de estudio inicial, la robótica. Nuevamente, la idea es fomentar el aprendizaje de algoritmos, pero en este caso aprovechando las interacciones del robot en su entorno. “El objetivo es utilizar la retroalimentación de la experiencia del robot como datos de aprendizaje adicionales para mejorar el reconocimiento de objetos y el movimiento del robot”, dice la investigadora.

Un potencial apasionante que interesa a la Körber Foundation

Existen numerosas aplicaciones potenciales para toda esta investigación. Algunas son obvias, como el desarrollo de robots para ayudar a las personas mayores, limpiar el hogar o intervenir en un entorno hospitalario. También existe el reconocimiento de acciones específicas (como buscar una persona comiendo, jugando o nadando, etc.) a partir de una base de datos de fotografías o vídeos.

Otras aplicaciones son más discretas, como la producción automática de audiodescripción de alta calidad para un vídeo o, a la inversa, la generación de imágenes o vídeos a partir de texto. Cordelia Schmid no se centra en otros campos, como la imaginería médica o la investigación del cambio climático, pero su trabajo también puede tener un gran impacto en estos ámbitos.

Todas estas investigaciones y la exitosa carrera de Cordelia Schmid reciben ahora el Körber European Science Prize… que también supone un impulso para futuras investigaciones.

¿Qué depara el futuro? Algoritmos más transparentes, robots multitarea y más

Voy a utilizar el dinero del premio para realizar otros estudios, por ejemplo, sobre el aspecto de la ‘caja negra’ de los algoritmos”, afirma la científica. En la actualidad, los algoritmos integran datos y entregan un resultado, pero lo que sucede entre estos dos pasos sigue siendo un misterio para el usuario. A Cordelia Schmid le gustaría agregar una forma de memoria a los algoritmos, que nos permitiría recopilar los datos utilizados durante la ejecución de una tarea.

Utilizando tanto el algoritmo como su memoria, pudimos obtener un resultado y los datos que permitieron ese resultado”, explica la directora de la investigación. “Es una forma de ver los factores esenciales en el proceso de toma de decisiones del algoritmo y así obtener una visión más clara de cómo funciona… lo que a su vez ayudará a mejorar el sistema”.

La investigadora también está interesada en la relación entre los algoritmos de reconocimiento de imágenes y de lenguaje: “Hay problemas similares, por lo que las soluciones podrían aplicarse a ambos tipos de algoritmos”. A ella le gustaría trabajar en robots capaces de integrar comandos de voz, pero que se mueven usando la visión. Si bien este Körber European Science Prize ha recompensado una carrera ya larga y rica, sin duda hay otros premios reservados para la investigación de Cordelia Schmid.

Premio Europeo de Ciencias Körber

Este premio fue creado en 1984 por la Fundación Alemana Körber, con el objetivo de apoyar a científicos europeos que lideran investigaciones innovadoras. Originalmente se otorgaba anualmente a un equipo de investigación, pero desde 2005 se otorga solo a un investigador al año. Los nominados son examinados y contactados por dos comités de investigación compuestos por expertos mundiales. ¿Por qué dos comités? En los años pares, el premio se otorga a un investigador en ciencias de la vida, mientras que, como en los años impares, se otorga a un científico físico (en matemáticas, informática o física, etc.).

Los nominados deben presentar un informe y las cinco mejores candidaturas se transmiten a un consejo de administración (diez expertos europeos) que elige al ganador. El premio ofrece un reconocimiento considerable junto con 1 millón de euros para futuras investigaciones. ¡Ocho ganadores anteriores del Premio Europeo de Ciencias Körber también ganaron el Premio Nobel!

Más información:

Körber Foundation press release: Cordelia Schmid (2023): Making AI More Intelligent – Smart Image Recognition for Autonomous Robots.

Discover the mini-site created by Körber-Stiftung.

France Is AI, ‘Automatic Understanding of the Visual World’ with Cordelia Schmid, France Digitale (20/11/2020).

Czech-French #AI Workshop, with Cordelia Schmid: ‘Large-scale Learning from Multimodal Videos’, CIIRC ČVUT (13/9/2022).

Cordelia Schmid: INRIA – Académie des sciences Grand Prize, INRIA (21/11/2018).

La reconnaissance visuelle distinguée par le Prix Longuet-Higgins [Visual recognition wins the Longuet-Higgins Prize] (in French), ENS-PSL (2016).

Local Grayvalue Invariants for Image Retrieval

Leído en:

Inria