En las entrañas de la Inteligencia Artificial: entrevista a Pablo Arbelaez

El Uniandino
19 ago 2020
10 Min. de lectura

En 1971 John McCarthy, prominente informático ganador del Premio Turing, acuñó la expresión “inteligencia artificial”, definiéndola como: “la ciencia e ingenio de hacer máquinas inteligentes, especialmente programas de cómputo inteligentes”. La idea se refundió en los laboratorios de las grandes universidades durante años, volviéndose un tema viral hace no más de una década atrás y convirtiéndose hoy en día en una tecnología omnipresente en nuestros aparatos electrónicos, ayudándonos a escoger la música que queremos escuchar, a filtrar las fotos de nuestras librerías, a poner nuestros filtros favoritos en videollamadas y a charlar con nuestros asistentes virtuales. En una entrevista con Pablo Arbelaez, profesor asociado del departamento de Ingeniería Biomédica, nos enteramos del estado de la inteligencia artificial en la universidad y hablamos sobre la apertura del centro CINFONIA, la nueva apuesta de Los Andes por la tecnología que está revolucionando el mundo.

Iniciando su carrera como matemático en la Universidad de los Andes y continuando sus estudios de maestría y doctorado en la misma área en la Université de Paris, ¿cómo terminó en el departamento de ingeniería biomédica?

Cuando entré a la universidad mis papás no tenían para pagar la matrícula de Los Andes, así que me dijeron que me pagaban la Universidad Nacional. En ese momento la universidad abrió un programa de becas que se llamó “beca 40 años”, por los cuarenta años de existencia, en las carreras de física, matemática y filosofía. Me imagino que porque esas carreras se estaban muriendo por falta de estudiantes. Entré a estudiar matemáticas y estudié toda mi carrera becado, pero nunca encontré mi pasión en Los Andes porque la inteligencia artificial (IA) sencillamente no existía en los años noventa en Colombia. Así que me fui a estudiar mis posgrados a Francia, aprovechando que allá la educación es pública y gratuita. Al final de mi doctorado tuve la oportunidad de presentar mi trabajo en una conferencia y allí conocí a un investigador muy importante en mi área que se llama Jitendra Malik. Él me invitó a trabajar en su laboratorio, sin ninguna carta de recomendación, únicamente viendo el trabajo que yo estaba proponiendo.

Viví en California trabajando Berkeley durante siete años y eso me permitió crecer mucho como investigador porque allá estaba con los duros, con los manes que escribieron el libro que yo leí en mi doctorado. Allí aprendí cómo manejar un grupo de investigación, que era lo que los hacía tan exitosos. En 2014 tomé la decisión de regresar a Colombia y en ese momento se dio la posibilidad a través de un programa del gobierno que se llamaba “Es tiempo de volver”. A mi me contrataron en Los Andes porque estaban iniciando el departamento de ingeniería biomédica y necesitaban a alguien que trabajara con imágenes biomédicas, así que me devolví a Colombia con el único objetivo de hacer una escuela de investigación en IA. Regresar a Los Andes fue cerrar el bucle, si quiere, poder devolverle al país y a la universidad todo lo que me habían dado cuando yo tenía su edad y no sabía qué quería en la vida.

¿Cuándo empezó a encontrar interés en el procesamiento de imágenes?

Inmediatamente. Cuando me fui a Francia, me fui a hacer una maestría primero en matemáticas aplicadas, porque como le digo no tenía idea de qué quería hacer, solo sabía que no quería seguir en las matemáticas puras. La maestría era muy interesante porque había doce cursos en doce áreas distintas de aplicación de las matemáticas y yo los tenía que ver todos. Entre esos cursos había tres en análisis matemáticos de imágenes. Yo me enamoré de la IA por las imágenes. Así llegué a esta área y conocí todo el potencial que tenía, porque en esa época era tan solo un sueño, una disciplina marginal en el mundo académico.

Dentro de sus estudios de maestría y doctorado ya empezó a presentar curiosidad por el campo de la segmentación, explíquenos un poco, ¿qué quiere decir este término en el campo de la visión artificial?

Las imágenes fueron mi entrada al mundo de la IA y la segmentación fue el primer problema del que me enamoré. La segmentación es una capacidad de nuestra percepción visual, es lo que nos permite separar a los objetos del fondo, se llama reagrupamiento perceptual. Cuando usted me mira es capaz de separar mi figura del tablero que está atrás y podría trazar una línea, delinear mi figura y marcar en rojo todos los pixeles que pertenecen a mi cuerpo. Lo que busca la segmentación es estudiar cómo los seres humanos llegaron a tener esa capacidad, cómo se refleja eso en nuestra percepción visual y nuestra capacidad para sobrevivir en este mundo, para desarrollar modelos computacionales que repliquen esa capacidad. En esta conversación usted está realizando una segmentación separando dos imágenes: una que soy yo y otra que es el fondo. O, fíjese, de pronto en tres: una que soy yo, otra que es el tablero y otra que es la pared. Puede haber múltiples interpretaciones.

¿Cómo ha evolucionado el campo de visión artificial desde que usted inició a trabajar en él?

Ha evolucionado de una manera increíble. Cuando yo inicié a trabajar en esta área no era muy claro si el problema en el que yo trabajaba estaba bien definido. Si usted le dice a dos personas que realicen la tarea que le indiqué probablemente van a hacer cosas distintas. Uno va a marcar mis gafas y otro va a separar mi cuello de la cabeza, entonces no era claro en el sentido de que no se podía medir si se estaba haciendo bien o no.

En el año 2000 surgió una base de datos muy importante que fue la base de datos de Berkeley en la que Jitendra Malik y su grupo propusieron un marco experimental para evaluar este problema. Esta manera de pensar se propagó a toda el área, la idea de tener marcos experimentales sólidos, muy grandes y que permitieran comparar ahí todos los métodos. Por otro lado, la idea de hacer el código público, la filosofía open source. Estos dos factores cambiaron todo, hicieron que esto pasara de ser un juego de niños ricos a que se volviera el centro de nuestras vidas.

Cuando yo comencé, si quería trabajar en un tema leía artículos y tenía que volver a implementarlos. Hoy en día, si un estudiante mío quiere comenzar un doctorado en un tema puede bajar el código del estado del arte, reproducir los resultados y empezar a construir sobre ese código. Todas estas plataformas como Github, que son las que están revolucionando el mundo de la computación, se basan en eso, en la colaboración. Después, en el 2012, aparecieron todos estos métodos magníficos de aprendizaje profundo o deep learning, que siempre habían estado, pero nunca habían funcionado. Adicionalmente, apareció el hardware especializado de Nvidia que son las GPUs. Gracias a esto por fin estas técnicas comenzaron a servir, por fin podía separar el computador a Pablo del fondo sin pegar un pedazo de mi cabeza al tablero. Cada vez hay más gente, cada vez hay más recursos, cada vez hay más ideas, estamos en un periodo de crecimiento exponencial y no vemos el techo, que es lo más emocionante de todo.

Dentro de sus líneas de investigación encontramos dos área grandes, la primera es el la aplicación de la visión artificial en la medicina y la segunda es el campo de visión artificial un poco más general, pero especialmente enfocado en la detección de emociones en los rostros a través del reconocimiento de microexpresiones. Cuéntenos un poco sobre estos dos campos.

Ese proyecto que usted menciona tuvo mucho eco en los medios porque fue ganador del premio Google de investigación para Latinoamérica tres años consecutivos. Mi estudiante doctoral, Andrés Felipe Romero, pudo financiar todo su doctorado gracias a eso. Comenzamos por detectar las pequeñas contracciones en los músculos de la cara para entender los sentimientos o las emociones de las personas. Ese proyecto tomó un desvío muy interesante, como siempre uno en la investigación sabe dónde comienza, pero no dónde termina. Esa idea nos llevó al problema de hacer que el computador invente caras con las expresiones que queremos, ese es el área de generación de imágenes que usa unas técnicas que se llaman Redes Generativas Antagónicas, las GANs. Es una tecnología emocionante, hacer que el computador alucine imágenes, es la tecnología por ejemplo que está detrás de los Deepfakes. Esta tecnología tiene serias implicaciones éticas, ha sido y será un actor en las próximas elecciones, pero esta es tan solo una aplicación de las infinitas que tiene la generación de imágenes.

Dentro de la primer área mencionada, el año anterior su equipo de investigación tuvo el honor de ser publicado en la conferencia Medical Image Computing and Computer Assisted Intervention (MICCAI) por el desarrollo de un modelo que permitía estimar la edad ósea en radiografías de manos de niños. Explíquenos, ¿en qué consistía este trabajo?

En mi área hay unas conferencias que son lo máximo y en las que uno quiere publicar. No en las revistas, esas son fáciles. Desde el año pasado por fin hemos podido publicar y ese es el trabajo de mis estudiantes de biomédica, muchas veces de maestría y algunas veces de pregrado cuando son estudiantes muy brillantes. Este proyecto es financiado por COLCIENCIAS, estamos en él desde el 2017 en colaboración con la Fundación Santa Fe. Lo que buscamos ahí es poder predecir qué tan grande va a ser un niño. Los médicos, para poder predecir eso toman un carpograma de la mano no hábil y estiman la edad ósea, la cual indica qué tanto se han desarrollado los huesos. Esta comparación se hace de manera visual y esto les permite predecir desórdenes de crecimiento, hormonales y otra cantidad de enfermedades que se pueden prevenir de manera oportuna. Nosotros desarrollamos un método que permitía automatizar este proceso.

Adicionalmente, el mismo año, junto a sus estudiantes Laura Bravo y Cristina Gonzales fueron ganadores de varias categorías en el concurso Robust Medical Instrument Segmentation (ROBUST-MIS) Challenge 2019, ¿cómo funcionaba este concurso?

Realmente todo el mérito de los éxitos de mi grupo se debe a mis estudiantes, yo solo le hablo carreta a ustedes los medios. Esta es una competencia abierta que pasa una vez al año, en donde hay unos datos y hay que desarrollar un sistema de IA que resuelva un problema. Uno envía los algoritmos, ellos los evalúan con unos datos secretos y sacan una lista de los mejores resultados. En la gran conferencia que es MICCAI hay un workshop especializado en esto y ahí se anuncian los ganadores y se dan los premios. El año pasado participamos por primera vez, pero estábamos en una situación muy desfavorable porque en esas competencias participan los mejores grupos del mundo. Grupos con supercomputadores, mientras que nosotros teníamos el equivalente a un computador de escritorio. Decidimos participar por la experiencia y trabajamos todo el periodo intersemestral el año pasado, mandamos nuestros resultados a ver qué pasaba y tuvimos la gran sorpresa de que ganamos muchos de los premios. Fue sorprendente porque los otros competidores contaban con un poderío computacional veinte y treinta veces más grande que el nuestro, pero les ganamos porque mis estudiantes tienen una experticia técnica que es de primer nivel.

Hace poco obtuvo el premio AI 2000 MOST INFLUENTIAL SCHOLAR AWARD. Este premio lo clasifica como uno de los 100 investigadores más influyentes en su disciplina en la última década. ¿Cuáles de sus áreas de investigación siente que han influido más para la obtención de este premio?

Yo le digo a mis hijas que Google Scholar es como el Facebook de los investigadores, en el sentido que no tengo posts sino artículos y no tengo likes sino citaciones. Esto quiere decir sencillamente que tengo muchos likes. Todos los investigadores que somos activos tenemos ahí nuestras publicaciones y las citas de cada una de estas. Lo que hicieron fue que contaron en mi área, en las grandes conferencias, cuantas citaciones había de mis artículos entre el 2010 y el 2020 e hicieron un ranking, donde yo tuve la suerte de quedar entre los cien primeros. Es el conjunto de mi carrera, pero por supuesto que mis artículos más citados son los de segmentación y el más citado de todos fue uno que hice en Berkeley con Jitendra Malik. Este artículo se volvió tan famoso porque diez años después de que se propusiera la primera versión de un marco experimental para la segmentación, Malik y yo propusimos la segunda y eso se volvió un estándar.

Pasemos a hablar un poco del nuevo centro CINFONIA, ¿qué se espera con esto?

Este es un inmenso motivo de alegría para mí porque he logrado hacer la escuela de investigación que soñaba cuando llegué hace seis años. Esta iniciativa lleva más de dos años, está liderada por la vicerrectoría de investigaciones, con participación de la decanatura de ingeniería y apoyada por ciencias y derecho. Logramos que esto fuera una realidad hace un mes cuando el consejo superior aprobó la creación de CINFONIA, el Centro para la Investigación y Formación en Inteligencia Artificial. En esta situación particular, en que no podemos contratar ni monitores, que la universidad haya decidido hacer esta inversión y abrir el centro realmente es una muestra de confianza por esta área y por el impacto que puede tener.

Con el centro esperamos, como número uno, la excelencia académica. Esa ha sido siempre nuestra característica, formar estudiantes e investigadores del mejor nivel internacional. Número dos, el aspecto ético, por eso la facultad de derecho ha estado ahí desde el comienzo. La característica de nuestra investigación es que es socialmente responsable, no crear robots que nos van a matar en el futuro, sino aquellos que nos van a ayudar a ser mejores seres humanos.

Usted ha trabajado en universidades de muy alto nivel como lo es la universidad de Berkeley. ¿Cuál es el estado de la investigación en la universidad comparado con ese tipo de universidades?

Lo bueno de la inteligencia artificial es que no se necesitan equipos de diez millones de dólares para estar entre los mejores. Capacidad técnica tenemos, prueba de ello no es la carreta que yo le digo a usted sino las publicaciones de mis estudiantes. Yo no soy el único que trabaja en esto, ni en la universidad, ni en Colombia. Sin embargo, lo que necesitamos es crear masa crítica, ese es uno de los objetivos de CINFONIA. Algo muy interesante del centro es que no va a ser solamente de Los Andes, vamos a tener investigadores afiliados de otras universidades, no va a ser un club mirando a Monserrate, va a ser un proyecto para el país.

La IA se vislumbra como el gran campo de la tecnología que permeará todas y cada una de las disciplinas, y de la vida cotidiana, por lo cual se presenta como un área de interés para muchas personas. Para aquellos que están leyendo esta entrevista y siempre hayan querido aprender cómo funciona el mundo de la IA, ¿qué les diría?, ¿cómo les recomendaría iniciar su formación?

Lo más importante es la curiosidad, como siempre. Lo primero que hay que tener es curiosidad y ganas de aprender. Rápidamente se da uno cuenta que hay mucha información disponible, es muy sencillo encontrar recursos en línea adaptados a todos los niveles. Plataformas como Coursera u otras, le permiten a uno empezar desde cursos introductorios, hasta temas un poco más avanzados. Estas plataformas hoy en día no reemplazan una educación formal, es decir, si uno sigue con curiosidad y con ganas de aprender lo más adecuado es que en algún punto busque educación formal. En ese momento esperamos que encuentren el centro de inteligencia artificial de Los Andes en donde van a tener acceso a todo el contexto y todas las oportunidades para trabajar en esta área.

Por: Carlos Bueno

Contacto

En las entrañas de la Inteligencia Artificial: entrevista a Pablo Arbelaez

Entradas recientes

Comentarios

Quiénes somos

Convocatoria

Apóyanos

Cursos