
Una nueva inteligencia artificial (IA) puede usar señales obtenidas en una sola noche para estimar el riesgo de sufrir unas 130 enfermedades, como el párkinson, la demencia, los infartos de miocardio y el cáncer de próstata y de mama.
Y puede hacerlo “años antes de que aparezcan los primeros síntomas”, según el científico de datos de Stanford James Zou, uno de los autores del estudio, publicado en la revista Nature Medicine.
Su nombre es SleepFM y fue entrenada con cientos de miles de horas sobre la base de datos del sueño. Fue desarrollada por el equipo de Rahul Thapa, científico de datos biomédicos de la Universidad de Stanford.
La investigación y medición del sueño en el laboratorio se denomina polisomnografía.
El proceso implica registrar simultáneamente las ondas cerebrales, la actividad cardíaca, la respiración, la tensión muscular, así como los movimientos oculares y de las piernas de los participantes. Para SleepFM, el equipo utilizó aproximadamente 585.000 horas de unas 65.000 personas de varios grupos, principalmente del Centro de Medicina del Sueño de Stanford.
“La polisomnografía registra una cantidad asombrosa de información fisiológica durante ocho horas en un sujeto completamente monitorizado. Es una fuente de datos extremadamente rica que hasta ahora estaba infrautilizada”, explicó Emmanuel Mignot, profesor de Medicina del Sueño en Stanford y uno de los autores principales del estudio.
El lenguaje del sueño
SleepFM es lo que se conoce como un modelo de base, una arquitectura de inteligencia artificial (IA) entrenada con enormes volúmenes de datos no etiquetados, similar en concepto a los grandes modelos de lenguaje como ChatGPT. En lugar de texto, este modelo aprende a interpretar el “lenguaje del sueño”.
Para ello, los investigadores dividieron los registros nocturnos en fragmentos de cinco segundos y entrenaron al sistema para integrar múltiples señales fisiológicas de forma simultánea. Uno de los avances técnicos clave fue el desarrollo de un método de aprendizaje autosupervisado que permite al modelo reconstruir una señal ausente a partir del resto, aprendiendo así cómo se relacionan entre sí los distintos sistemas del cuerpo.
“Desde la perspectiva de la IA, el sueño ha sido sorprendentemente poco estudiado, a pesar de que ocupa un tercio de nuestra vida”, señaló James Zou, profesor asociado de ciencia de datos biomédicos en Stanford y coautor principal. “SleepFM básicamente aprende a entender el idioma del cuerpo mientras dormimos”.
Tras ese entrenamiento básico, SleepFM fue afinado para tareas como la detección de fases del sueño y el diagnóstico de la apnea del sueño, y se obtuvieron valores que pueden competir con métodos establecidos como U-Sleep o YASA. Estos dos programas usan datos de los electroencefalogramas (EEG), con los que se miden las ondas cerebrales, para reconocer y analizar los estadios del sueño.
De más de 1.000 categorías, el modelo identificó 130 enfermedades cuyo riesgo se pudo predecir con una precisión entre moderada y alta. Las predicciones fueron especialmente precisas para la demencia, la el párkinson, el infarto de miocardio, la insuficiencia cardíaca, ciertos tipos de cáncer y la mortalidad general.
¿Por qué no se adopta aún en hospitales?
Los investigadores enfatizan explícitamente que SleepFM no descubre las causas de la enfermedad, sino que más bien establece correlaciones: reconoce patrones estadísticos en el sueño, que podrían estar relacionados con diagnósticos posteriores.
A diferencia de otras estrategias predictivas basadas en resonancia magnética, PET o biomarcadores invasivos, los datos del sueño ofrecen una alternativa no invasiva y potencialmente más accesible. Los autores destacan que, en el futuro, la combinación de modelos como SleepFM con dispositivos portátiles de monitorización del sueño podría permitir una vigilancia continua de la salud y una estratificación temprana del riesgo.
No obstante, los investigadores reconocen importantes limitaciones. La cohorte analizada procede en su mayoría de pacientes derivados a clínicas del sueño, por lo que no representa a la población general. Además, la complejidad del modelo dificulta interpretar exactamente qué patrones concretos impulsan cada predicción, un desafío clave para su adopción clínica.