Resumen

HAMELIN: HUMAN-GUIDED AUTOMATED MACHINE LEARNING FOR CLINICAL STUDIES

APRENDIZAJE AUTOMÁTICO AUTOMATIZADO GUIADO POR HUMANOS PARA ESTUDIOS CLÍNICOS

Los ensayos clínicos desempeñan un papel crucial en el avance del conocimiento médico y aseguran la seguridad y eficacia de las prácticas médicas antes de su adopción generalizada. En algunos casos, los ensayos clínicos también pueden incorporar técnicas de aprendizaje automático para analizar e interpretar datos complejos, mejorando los resultados de la investigación.

El Aprendizaje Automático Automatizado (AutoML, Automated Machine Learning) puede capacitar a profesionales de la investigación clínica (CRPs, Clinical Research Professionals) para construir modelos de aprendizaje automático sin necesidad de poseer un extenso conocimiento en este ámbito. A pesar de los avances significativos en AutoML, persiste una brecha notable en la disponibilidad de herramientas que permitan a no expertos en aprendizaje automático crear sus propios modelos.

Para abordar este problema, surge el aprendizaje automático guiado por humanos (HGML, Human-Guided Machine Learning) como un enfoque híbrido en el que un usuario interactúa con un sistema AutoML y le asigna tareas para explorar la construcción de modelos de aprendizaje automático usando el conocimiento del usuario sobre los datos disponibles y el dominio de aplicación.

El proyecto explora una solución al problema de realizar estudios clínicos cuando los CRPs carecen de conocimientos suficientes en el ámbito de la Ciencia de Datos. Al dotar a los CRPs de un sistema HGML, el proyecto contribuye a eliminar la necesidad de científicos de datos expertos, lo que permitiría una mayor accesibilidad de las técnicas de ML para su aplicación a estudios clínicos.

Este proyecto, en definitiva, propone (i) desarrollar un sistema HGML que permita a los CRPs interactuar con sistemas AutoML para construir modelos de aprendizaje automático usando el conocimiento de estos profesionales sobre los datos médicos disponibles; y (ii) evaluar la viabilidad de emplear el enfoque HGML en la construcción de modelos predictivos basados en los datos gestionados por los CRPs.

Proyecto PID2023-146243OB-I00 financiado por: