Entrevista

“Las máquinas pueden aprender a detectar y clasificar patologías”

A través de modelos matemáticos, el ingeniero en sistemas Enzo Ferrante entrena máquinas para que puedan asistir a los médicos en el diagnóstico de enfermedades y anomalías cardíacas. Aplicaciones, ventajas y perspectivas que abre el “Machine Learning” en Argentina. Por Darío Sandrone

1020
1020
Darío Sandrone Darío Sandrone 16-12-2021

Enzo Ferrante es ingeniero de sistemas de la Universidad Nacional del Centro de la Provincia de Buenos Aires, con sede en Tandil. Desde su tesis de grado trabajó con imágenes médicas (rayos x, tomografías computadas, resonancias magnéticas), y luego hizo el doctorado en informática en Francia, en el INRIA Institut National de Recherche en Informatique et en Automatique, y un posdoctorado en Inglaterra, en Imperial College of Science, Technology and Medicine, donde profundizó sus estudios en machine learning aplicada a la salud. 

En 2017 se convirtió en uno de los científicos repatriados y se instaló en la ciudad de Santa Fe. Hoy es investigador adjunto de Conicet con sede de trabajo en el Instituto de Investigación en Señales, Sistemas e Inteligencia Computacional del Departamento de Informática de la Facultad de Ingeniería y Ciencias Hídricas (FICH) de la Universidad Nacional del Litoral (UNL), donde también es docente. La especialidad de Enzo son las máquinas que aprenden de los corazones humanos, y trabaja entrenando algoritmos para que puedan tomar decisiones a la hora de diagnosticar alguna patología cardíaca a partir de los datos que se les suministran, en este caso, imágenes biométricas. 

-¿Por qué se usa el machine learning en el diagnóstico por imágenes? ¿Qué es, y qué información te aporta, que no te brinda el ojo humano? 

-La palabra clave cuando hablamos de machine learning es “datos” porque es la fuente de información. El machine learning o el aprendizaje automático, como se dice en español, es un campo dentro de las Ciencias de la computación donde la idea es generar modelos que puedan aprender a partir de datos, y extrapolar conclusiones a partir de estos. En general, son modelos estadísticos o computacionales. Hay distintos paradigmas. En el paradigma de aprendizaje supervisado, que es el más utilizado, en general, para crear modelos predictivos, lo que hacemos es mostrarle un montón de datos al modelo, con etiquetas asociadas. Por ejemplo, supongamos que vos querés entrenar un modelo para que te diga si en una imagen hay un gato o hay un perro. Entonces le mostrás fotos y le decís: “En esta imagen hay un gato, en esta un perro, etc”. Por eso se llama “paradigma del aprendizaje supervisado”, porque el modelo toma datos que ya están anotados y trata de imitar esa anotación. La idea es que después le presentes datos que el modelo nunca vio, y lo que aprendió lo extrapole a esos datos.

-O sea, le ponés la foto de un perro, y en la salida el modelo tira la etiqueta: “perro”.

-Exactamente.

-Sólo que, en tu caso, en lugar de perros y gatos entrenan al modelo con imágenes de cerebros y corazones, ¿así sería?  

-Claro. Por ejemplo: cargás una imagen de rayos x de un corazón para ver si esa persona tiene cardiomegalia (dilatación del corazón). Entonces, le das una gran base de datos en la que hay una gran cantidad de imágenes de corazones y le indicás: “En esta hay cardiomegalia, en esta no, en esta sí, en esta no...” para que luego pueda extrapolar conclusiones. 

-De modo que las bases de datos son un montón de imágenes etiquetadas. ¿De qué número estamos hablando para una buena base de datos? 

-Para este problema en particular de rayos x, hay bases de datos que tienen de 100 mil a 200 mil imágenes anotadas. 

-¿Cómo se producen esas bases de datos, se descargan, se compran a un proveedor? 

-En general, yo he trabajado con bases de datos públicas, que están disponibles. Por ejemplo, los Institutos Nacionales de Salud (NIH) de los Estados Unidos, o la Universidad de Standford, han liberado bases de datos de rayos x, con sus etiquetas asociadas.

-¿Las etiquetas siempre son de patologías o son también de rasgos del órgano?

-Depende mucho del problema de aplicación en el que estés trabajando. En particular, yo he trabajado mucho en problemas de clasificación de patologías en imágenes de rayos x, pero también he trabajado el problema de segmentación de imágenes cerebrales, donde lo que buscás no es si hay o no patología, sino, qué pixel de la imagen exactamente contiene un objeto de interés. 

-¿Cuál sería un caso concreto en este trabajo?

-Por ejemplo, si en una imagen hay un tumor cerebral, el médico debería ampliar esa imagen y señalar “a ojo” pixel por pixel: “Acá hay tumor, acá no, acá hay edema, etc”, con el propósito de señalar cuál es el tamaño del tumor y ver si luego el tratamiento de radioterapia da algún resultado. Entonces, lo que nosotros hacemos es tomar una base de datos, que ya fueron anotadas por médicos, y entrenamos modelos de aprendizaje automático, en particular de aprendizaje profundo (deep learning), que es un subtipo de método dentro del aprendizaje automático, para que aprendan a segmentar y hacer más rápido la tarea que a un médico le llevaría horas. Está bueno descargarles de esa tarea, para que puedan hacer otras cosas.

-¿Eso sería parte del diagnóstico?

-Asistencia al diagnóstico.

-Algo así como un diagnóstico asistido por algoritmos...

-Claro. Estos sistemas se llaman Computer-aided detection (CADe, Detección asistida por computadoras) o Computer-aided diagnosis (CADx, diagnóstico asistido por computadoras). 

-La pregunta que surge es si nos encaminamos a un horizonte “sin médicos”, con científicos de la información que participen de todo el proceso de diagnóstico.

-No, yo nunca voy a estar en una sala con el paciente. Yo miro las imágenes como matrices de números, que es lo que son para mí. Tampoco capacito médicos: yo trabajo con ingenieros, y trabajamos en colaboración con médicos. También dirijo a dos becarias en el Hospital Italiano de Buenos Aires, que están haciendo su tesis doctoral desarrollando estas herramientas en el hospital y yo les dirijo su doctorado. 

-¿Tenés una opinión formada sobre hacia dónde va el machine learning en medicina y cuáles pueden ser las consecuencias sociales? 

-Estas tecnologías se están empezando a adoptar, y es probable que se adopten más y más. No creo que lleguemos al punto en que un médico no intervenga en el proceso. Además, ahí entraría una cuestión legal o ética de quién es finalmente el responsable del diagnóstico. Si un médico firma el diagnóstico asume la responsabilidad. Pero, si es la máquina, ¿a quién vas a juzgar? ¿A la empresa que la desarrolló, al programador?  

Suscribite al newsletter

Redacción Mayo

* no spam