fbpx Saltar al contenido

Transformadores generativos y salud: descubre Delphi‑2M y el futuro de la predicción de enfermedades

predicción de enfermedades

La inteligencia artificial (IA) está revolucionando la medicina. Hace unos años, los modelos que analizaban datos de salud se limitaban a predecir la probabilidad de una enfermedad concreta basándose en variables individuales. Hoy, los algoritmos inspirados en los transformers que dan vida a los chatbots se adaptan para aprender el curso natural de muchas enfermedades a la vez. Este avance abre la puerta a un nuevo enfoque de la prevención: anticipar la aparición de más de mil diagnósticos basándose en la historia clínica, el estilo de vida y el contexto social de cada persona. En este artículo exploramos el funcionamiento del modelo Delphi‑2M, sus resultados y sus limitaciones, así como sus implicaciones para la nutrición personalizada y la salud pública.

¿Qué es un transformador generativo y cómo se aplica a la salud?

Los transformers son redes neuronales que, mediante una arquitectura de atención, analizan secuencias de datos para predecir el siguiente elemento de la secuencia. Su aplicación más conocida son los modelos de lenguaje que generan texto coherente. Esta capacidad de reconocer patrones temporales también es útil para entender cómo evoluciona la salud a lo largo de la vida. La progresión de la enfermedad está influenciada por un mosaico de factores genéticos, ambientales y de estilo de vida, y se manifiesta en diagnósticos que se acumulan con el tiempo【559897564668818†L49-L69】. Un transformador puede representar esta evolución como una secuencia de eventos codificados mediante la Clasificación Internacional de Enfermedades (ICD‑10), utilizando una codificación del tiempo basada en la edad y ampliando el modelo para predecir tanto el tipo de evento como el intervalo hasta que ocurra【559897564668818†L163-L176】.

Delphi‑2M es una versión adaptada de GPT que integra estas mejoras. Sustituye la codificación posicional clásica por una codificación continua basada en la edad, permite predecir el momento exacto del siguiente diagnóstico mediante un modelo de espera exponencial, y añade máscaras de atención que impiden que el algoritmo se confunda cuando varios eventos se registran a la misma edad【559897564668818†L163-L176】. Además, incorpora tokens que representan el sexo, el índice de masa corporal (IMC), el consumo de tabaco y alcohol, que se utilizan como información de entrada pero no se predicen【559897564668818†L148-L176】.

Delphi‑2M: entrenamiento en cohortes masivas y rendimiento

Para entrenar Delphi‑2M, los investigadores utilizaron los registros de salud de 402 799 participantes del UK Biobank y validaron el modelo en 1,93 millones de personas de los registros sanitarios daneses. La cohorte británica se dividió en un 80 % para el entrenamiento y un 20 % para validar los hiperparámetros【559897564668818†L153-L160】. El modelo trabaja con un vocabulario de 1 258 tokens que incluyen diagnósticos de nivel superior ICD‑10, sexo, categorías de IMC, consumo de tabaco y alcohol, así como eventos “sin enfermedad” que ayudan a calibrar el modelo en periodos de tiempo sin diagnósticos【559897564668818†L148-L176】. El modelo final contaba con aproximadamente 2,2 millones de parámetros, 12 capas y 12 cabezas de atención, un tamaño que resultó óptimo según las leyes de escalado observadas en el estudio【559897564668818†L185-L195】.

Los resultados demuestran que el modelo predice con precisión el próximo diagnóstico para una amplia gama de enfermedades. En los datos de validación internos, el área bajo la curva (AUC) fue de alrededor de 0,76, y más del 97 % de los diagnósticos obtuvieron un AUC superior a 0,5【559897564668818†L220-L232】. El modelo mostró diferencias según el capítulo de ICD‑10: algunas enfermedades, como el asma o la artrosis, tienen un margen estrecho de predicción, mientras que otras, como la septicemia o la muerte, presentan una variabilidad amplia entre individuos【559897564668818†L220-L225】. Para horizontes de hasta diez años, el AUC se mantiene cerca de 0,70, lo que sugiere que también es útil para pronósticos a largo plazo【559897564668818†L246-L248】.

El rendimiento de Delphi‑2M es comparable o superior al de muchos algoritmos de predicción clínica existentes. En el estudio se observó que el modelo iguala o supera a las ecuaciones de Framingham y otras puntuaciones de riesgo cardiovascular, se aproxima a los modelos de demencia y supera a un algoritmo que utiliza 67 biomarcadores para predecir diversos diagnósticos【559897564668818†L252-L269】. La precisión disminuyó ligeramente al aplicarse a los datos daneses (AUC medio de 0,67), pero las predicciones entre ambas cohortes presentaron una correlación alta【559897564668818†L1218-L1230】, lo que indica que muchas de las pautas aprendidas reflejan la verdadera evolución de la multimorbilidad.

Generación de trayectorias de salud y estimación de cargas de enfermedad

Una ventaja única de Delphi‑2M es su naturaleza generativa. A diferencia de los modelos convencionales, puede simular trayectorias de salud futuras en función de la historia clínica hasta la fecha. Esto permite estimar las tasas de múltiples enfermedades y la carga acumulada de morbilidad durante periodos de hasta veinte años【559897564668818†L24-L32】. En el estudio, se generaron trayectorias para más de 63 000 participantes a partir de su historial hasta los 60 años; las incidencias de enfermedades predichas entre los 70 y 75 años coincidieron notablemente con las observadas en la población real【559897564668818†L470-L481】.

La posibilidad de muestrear datos sintéticos tiene implicaciones importantes para la investigación. Permite crear conjuntos de datos que preservan las co‑ocurrencias estadísticas de enfermedades sin exponer registros personales, facilitando el desarrollo de otros modelos de IA con menor riesgo de vulnerar la privacidad【559897564668818†L1470-L1479】. Desde la perspectiva de la salud pública, estas trayectorias podrían ayudar a anticipar la demanda de servicios sanitarios, optimizar campañas de prevención y adaptar programas de cribado. Para la nutrición personalizada, estimar la futura probabilidad de trastornos metabólicos o cardiovasculares podría guiar intervenciones tempranas en la dieta y el estilo de vida.

Sesgos y limitaciones: por qué debemos ser cautelosos

Delphi‑2M no está exento de limitaciones. El modelo aprende de los datos disponibles y reproduce sus sesgos. El UK Biobank incluye principalmente a participantes de entre 40 y 70 años; las personas más jóvenes y las muertes antes del reclutamiento quedan infrarrepresentadas, lo que crea un sesgo de “tiempo inmortal” y subestima la mortalidad temprana【559897564668818†L1417-L1424】. La cohorte británica también incluye mayor proporción de individuos con altos niveles educativos y de ingresos, lo que conduce a un “sesgo del voluntario sano” y a una menor prevalencia de ciertos diagnósticos【559897564668818†L1410-L1414】.

El origen de los datos influye en las predicciones. Los registros de atención primaria contienen sobre todo enfermedades comunes, mientras que los datos hospitalarios recogen patologías graves como infarto de miocardio o septicemia. Cuando un diagnóstico sólo aparece en un entorno (por ejemplo, hospitalario), el modelo puede inferir que otros diagnósticos hospitalarios aumentan su probabilidad, aun cuando esta relación sea un artefacto del sistema de registro【559897564668818†L1437-L1444】. Este efecto puede multiplicar por ocho la tasa de septicemia entre personas que han tenido cualquier otro evento hospitalario【559897564668818†L1437-L1444】.

Además, el modelo predice tasas diferentes según la ascendencia y el índice de privación, y no detecta tendencias claras entre el estilo de vida y el año de nacimiento【559897564668818†L1494-L1501】. Estas observaciones recuerdan la importancia de disponer de datos representativos y de evaluar la equidad de los algoritmos. Delphi‑2M tampoco contempla todavía información genómica, metabolómica ni de dispositivos portátiles, que podrían mejorar la individualización de las predicciones【559897564668818†L1505-L1513】.

Aplicaciones en nutrición personalizada y estilo de vida

La capacidad de prever la evolución de múltiples patologías ofrece nuevas oportunidades para la nutrición de precisión. Conocer la probabilidad de desarrollar diabetes tipo 2 o enfermedades cardiovasculares en las próximas dos décadas permite diseñar planes de alimentación y actividad física personalizados. Herramientas como Oorenji y nuestra plataforma Mefood Omics ya utilizan algoritmos para recomendar menús equilibrados basados en el historial clínico, el microbioma y los hábitos alimentarios. Integrar modelos generativos como Delphi‑2M con caloo.app o con Alimentómica permitiría anticipar necesidades nutricionales y complementar la dieta con micronutrientes específicos. Además, la simulación de trayectorias podría ayudar a identificar ventanas óptimas para intervenir antes de que aparezcan síntomas.

Es importante destacar que ninguna predicción sustituye el consejo médico ni justifica decisiones sanitarias precipitadas. La IA puede orientar, pero sólo un profesional puede interpretar los riesgos en el contexto de cada persona. Además, factores como el estrés, el sueño o el entorno socioeconómico influyen en la salud y deben abordarse de forma holística. Plataformas como recetas.oorenji.com ofrecen recetas saludables y educativas que pueden acompañar cualquier plan preventivo.

Conclusión y llamado a la acción

Delphi‑2M demuestra que los transformadores generativos pueden aprender la historia natural de las enfermedades y predecir riesgos a gran escala【559897564668818†L1453-L1470】. El modelo supera a muchos algoritmos tradicionales y permite simular trayectorias sanitarias, pero también pone de relieve los sesgos inherentes a los datos y la necesidad de una evaluación ética rigurosa【559897564668818†L1492-L1503】. Para los profesionales de la nutrición, la IA abre un campo prometedor: unir la predicción de riesgos con intervenciones dietéticas personalizadas.

Si deseas saber más sobre cómo las nuevas tecnologías pueden ayudarte a mejorar tu salud, visita nuestros recursos en Mefood Omics y explora las soluciones de Oorenji. Recuerda que adoptar hábitos saludables, mantener una alimentación equilibrada y realizar actividad física siguen siendo pilares fundamentales para prevenir enfermedades. La IA es una aliada poderosa, pero tu compromiso es insustituible.

Referencias

  1. Shmatko A. et al. Learning the natural history of human disease with generative transformers – Nature
  2. Conroy G. Which diseases will you have in 20 years? This AI accurately predicts your risks – Nature News
  3. Gregory A. New AI tool can predict a person’s risk of more than 1,000 diseases – The Guardian
es_ESEspañol
×