Pablo Morales-Álvarez, Pablo Ruiz, Scott Coughlin, Rafael Molina y Aggelos K. Katsaggelos
PREMIOS SOCIEDAD DE ESTADÍSTICA E INVESTIGACIÓN OPERATIVA (SEIO)-FUNDACIÓN BBVA
Mejor contribución aplicada en Estadística
2023
Por su artículo artículo "Scalable variational Gaussian processes for crowdsourcing: Glitch detection in LIGO" ("Procesos gaussianos variacionales escalables para el crowdsourcing: detección de fallos en LIGO"), publicado en IEEE Transactions on Pattern Analysis and Machine Intelligence, un artículo "muy innovador" según recoge el acta del jurado.
CONTRIBUCIÓN
Las ondas gravitacionales han supuesto una nueva forma de explorar el universo desde que se detectaron por primera vez en 2015 a través del observatorio LIGO (Estados Unidos), demostrando con ello una de las predicciones de Albert Einstein recogida en la teoría de la relatividad general. Entre todas las señales que recibe este observatorio, muchas no son ondas gravitacionales, sino otros patrones de ruido que se producen por movimientos de la Tierra o por otro tipo de fenómenos externos.
Para facilitar su identificación, el investigador Pablo Morales Álvarez, profesor ayudante doctor de Estadística e Investigación Operativa en la Universidad de Granada, junto con su equipo, ha desarrollado un sistema de inteligencia artificial que permite distinguir entre ondas gravitacionales y esos otros patrones de ruido de entre las señales que detecta el proyecto LIGO. Los resultados de su investigación se han plasmado en el artículo «Scalable variational Gaussian processes for crowdsourcing: Glitch detection in LIGO» (‘Procesos gaussianos variacionales escalables para el crowdsourcing: detección de fallos en LIGO’), publicado en IEEE Transactions on Pattern Analysis and Machine Intelligence.
«La técnica estadística que utilizamos se conoce como procesos gaussianos, que permiten analizar un conjunto de datos que esté etiquetado. En este caso son señales, unas etiquetadas como ondas gravitacionales y otras como ruido», explica el investigador.
En su trabajo, el equipo ha incorporado un elemento innovador en la estadística conocido como crowdsourcing o colaboración masiva. «Estos algoritmos necesitan un conjunto de datos muy grande para aprender de ahí, y los físicos expertos en ondas gravitacionales no disponen de tiempo para anotar un conjunto tan grande. Entonces se recurrió a voluntarios formados para distinguir ondas gravitacionales de ruido, que consiguieron anotar un conjunto de datos muy grande», señala Morales. En concreto, participaron más de 30.000 voluntarios que proporcionaron más de siete millones de anotaciones para más de un millón de señales.
En la actualidad disponemos de gran cantidad de datos en muchos ámbitos, por lo que estas técnicas de colaboración masiva se pueden aplicar en numerosos campos. «Ahora mismo las estamos empleando para detectar cánceres en imágenes de biopsia —señala—. Los patólogos no tienen tiempo para etiquetar miles de imágenes digitalizadas de biopsias, por lo que hemos recurrido a estudiantes de medicina voluntarios para el etiquetado. Con el conjunto de datos queremos hacer predicciones con el objetivo último de desarrollar un sistema de ayuda al diagnóstico médico de este tipo de patología».