fbpx Saltar al contingut

Transformadors generatius i salut: descobreix Delphi‑2M i el futur de la predicció de malalties

predicción de enfermedades

La intel·ligència artificial (IA) està revolucionant la medicina. Fa uns quants anys, els models que analitzaven dades de salut es limitaven a predir la probabilitat d'una malaltia concreta basant-se en variables individuals. Avui, els algorismes inspirats en els transformers que donen vida als chatbots s'adapten per aprendre el curs natural de moltes malalties alhora. Aquest avenç obre la porta a un nou enfocament de la prevenció: anticipar l?aparició de més de mil diagnòstics basant-se en la història clínica, l?estil de vida i el context social de cada persona. En aquest article explorem el funcionament del model Delphi‑2M, els resultats i les limitacions, així com les implicacions per a la nutrició personalitzada i la salut pública.

Què és un transformador generatiu i com s'aplica a la salut?

Els transformers són xarxes neuronals que, mitjançant una arquitectura d'atenció, analitzen seqüències de dades per predir el següent element de la seqüència. La seva aplicació més coneguda són els models de llenguatge que generen text coherent. Aquesta capacitat de reconèixer patrons temporals també és útil per entendre com evoluciona la salut al llarg de la vida. La progressió de la malaltia està influenciada per un mosaic de factors genètics, ambientals i d'estil de vida, i es manifesta en diagnòstics que s'acumulen amb el temps【559897564668818†L49-L69】. Un transformador pot representar aquesta evolució com una seqüència d'esdeveniments codificats mitjançant la Classificació Internacional de Malalties (ICD‑10), utilitzant una codificació del temps basada en l'edat i ampliant el model per predir tant el tipus d'esdeveniment com l'interval fins que passi[559897564668818†L163-L1.

Delphi‑2M és una versió adaptada de GPT que integra aquestes millores. Substitueix la codificació posicional clàssica per una codificació continua basada en l'edat, permet predir el moment exacte del següent diagnòstic mitjançant un model de espera exponencial, i afegeix màscares d'atenció que impedeixen que l'algorisme es confongui quan diversos esdeveniments es registren a la mateixa edat【559897564668818†L163-L176】. A més, incorpora tokens que representen el sexe, l'índex de massa corporal (IMC), el consum de tabac i alcohol, que s'utilitzen com a informació d'entrada però no es prediuen【559897564668818†L148-L176】.

Delphi‑2M: entrenament en cohorts massives i rendiment

Per entrenar Delphi‑2M, els investigadors van utilitzar els registres de salut de 402 799 participants de l'UK Biobank i van validar el model a 1,93 milions de persones dels registres sanitaris danesos. La cohort britànica es va dividir en un 80 % per a l'entrenament i un 20 % per validar els hiperparàmetres【559897564668818†L153-L160】. El model treballa amb un vocabulari de 1258 tokens que inclouen diagnòstics de nivell superior ICD‑10, sexe, categories d'IMC, consum de tabac i alcohol, així com esdeveniments “sense malaltia” que ajuden a calibrar el model en períodes de temps sense diagnòstics【559897564668818†L148. El model final comptava amb aproximadament 2,2 milions de paràmetres, 12 capes i 12 caps d'atenció, una grandària que va resultar òptima segons les lleis d'escalat observades a l'estudi【559897564668818†L185-L195】.

Els resultats demostren que el model prediu amb precisió el proper diagnòstic per a una àmplia gamma de malalties. En les dades de validació internes, l'àrea sota la corba (AUC) va ser d'uns 0,76, i més del 97 % dels diagnòstics van obtenir un AUC superior a 0,5【559897564668818†L220-L232】. El model va mostrar diferències segons el capítol d'ICD‑10: algunes malalties, com l'asma o l'artrosi, tenen un marge estret de predicció, mentre que d'altres, com la septicèmia o la mort, presenten una variabilitat àmplia entre individus【559897564668818†L220-L225】. Per a horitzons de fins a deu anys, l'AUC es manté prop de 0,70, la qual cosa suggereix que també és útil per a pronòstics a llarg termini【559897564668818†L246-L248】.

El rendiment de Delphi‑2M és comparable o superior al de molts algorismes de predicció clínica existents. A l'estudi es va observar que el model iguala o supera les equacions de Framingham i altres puntuacions de risc cardiovascular, s'aproxima als models de demència i supera un algorisme que utilitza 67 biomarcadors per predir diversos diagnòstics【559897564668818†L252-L26. La precisió va disminuir lleugerament en aplicar-se a les dades daneses (AUC mitjà de 0,67), però les prediccions entre ambdues cohorts van presentar una correlació alta【559897564668818†L1218-L1230】, la qual cosa indica que moltes de les pautes apreses reflecteixen la veritable evolució de la multiplicació.

Generació de trajectòries de salut i estimació de càrregues de malaltia

Un avantatge únic de Delphi‑2M és la seva naturalesa generativa. A diferència dels models convencionals, pot simular trajectòries de salut futures en funció de la història clínica fins ara. Això permet estimar les taxes de múltiples malalties i la càrrega acumulada de morbiditat durant períodes de fins a vint anys【559897564668818†L24-L32】. A l'estudi, es van generar trajectòries per a més de 63 000 participants a partir del seu historial fins als 60 anys; les incidències de malalties predites entre els 70 i 75 anys van coincidir notablement amb les observades en la població real【559897564668818†L470-L481】.

La possibilitat de mostrejar dades sintètiques té implicacions importants per a la investigació. Permet crear conjunts de dades que preserven les coocurrències estadístiques de malalties sense exposar registres personals, facilitant el desenvolupament d'altres models d'IA amb menor risc de vulnerar la privadesa【559897564668818†L1470-L1479】. Des de la perspectiva de la salut pública, aquestes trajectòries podrien ajudar a anticipar la demanda de serveis sanitaris, optimitzar campanyes de prevenció i adaptar programes de cribratge. Per a la nutrició personalitzada, estimar la futura probabilitat de trastorns metabòlics o cardiovasculars podria guiar intervencions primerenques a la dieta i l'estil de vida.

Biaixos i limitacions: per què hem de ser cautelosos

Delphi‑2M no està exempt de limitacions. El model aprèn dades disponibles i reprodueix els seus biaixos. L'UK Biobank inclou principalment participants d'entre 40 i 70 anys; les persones més joves i les morts abans del reclutament queden infrarepresentades, cosa que crea un biaix de “temps immortal” i subestima la mortalitat primerenca【559897564668818†L1417-L1424】. La cohort britànica també inclou major proporció d'individus amb alts nivells educatius i d'ingressos, cosa que condueix a un “biaix del voluntari sa” ia una menor prevalença de certs diagnòstics【559897564668818†L1410-L1414】.

L'origen de les dades influeix a les prediccions. Els registres d'atenció primària contenen sobretot malalties comunes, mentre que les dades hospitalàries recullen patologies greus com a infart de miocardi o septicèmia. Quan un diagnòstic només apareix en un entorn (per exemple, hospitalari), el model pot inferir que altres diagnòstics hospitalaris augmenten la seva probabilitat, encara que aquesta relació sigui un artefacte del sistema de registre【559897564668818†L1437-L1444】. Aquest efecte pot multiplicar per vuit la taxa de septicèmia entre persones que han tingut qualsevol altre esdeveniment hospitalari【559897564668818†L1437-L1444】.

A més, el model prediu taxes diferents segons l'ascendència i l'índex de privació, i no detecta tendències clares entre l'estil de vida i l'any de naixement【559897564668818†L1494-L1501】. Aquestes observacions recorden la importància de disposar de dades representatives i avaluar l'equitat dels algorismes. Delphi‑2M tampoc contempla encara informació genòmica, metabolòmica ni de dispositius portàtils, que podrien millorar la individualització de les prediccions【559897564668818†L1505-L1513】.

Aplicacions en nutrició personalitzada i estil de vida

La capacitat de preveure lʻevolució de múltiples patologies ofereix noves oportunitats per a la nutrició de precisió. Conèixer la probabilitat de desenvolupar diabetis tipus 2 o malalties cardiovasculars durant les properes dues dècades permet dissenyar plans d'alimentació i activitat física personalitzats. Eines com Oorenji i la nostra plataforma Mefood Omics ja utilitzen algorismes per recomanar menús equilibrats basats en l'historial clínic, el microbioma i els hàbits alimentaris. Integrar models generatius com Delphi‑2M amb caloo.app o amb Alimentòmica permetria anticipar necessitats nutricionals i complementar la dieta amb micronutrients específics. A més, la simulació de trajectòries podria ajudar a identificar finestres òptimes per intervenir abans que apareguin símptomes.

És important destacar que cap predicció substitueix el consell mèdic ni justifica decisions sanitàries precipitades. La IA pot orientar però només un professional pot interpretar els riscos en el context de cada persona. A més, factors com l'estrès, el son o l'entorn socioeconòmic influeixen en la salut i cal abordar-los de manera holística. Plataformes com receptes.oorenji.com ofereixen receptes saludables i educatives que poden acompanyar qualsevol pla preventiu.

Conclusió i crida a lacció

Delphi‑2M demostra que els transformadors generatius poden aprendre la història natural de les malalties i predir riscos a gran escala【559897564668818†L1453-L1470】. El model supera molts algorismes tradicionals i permet simular trajectòries sanitàries, però també posa en relleu els biaixos inherents a les dades i la necessitat d'una avaluació ètica rigorosa【559897564668818†L1492-L1503】. Pels professionals de la nutrició, la IA obre un camp prometedor: unir la predicció de riscos amb intervencions dietètiques personalitzades.

Si vols saber més sobre com les noves tecnologies poden ajudar-te a millorar la teva salut, visita els nostres recursos a Mefood Omics i explora les solucions de Oorenji. Recorda que adoptar hàbits saludables, mantenir una alimentació equilibrada i fer activitat física segueixen sent pilars fonamentals per prevenir malalties. La IA és una aliada poderosa, però el teu compromís és insubstituïble.

Referències

  1. Shmatko A. et al. Learning the natural history of human disease with generative transformers – Nature
  2. Conroy G. Which diseases will you have in 20 years? This AI accurately predicts your risks – Nature News
  3. Gregory A. New AI tool can predict person's risk of more than 1,000 dissenys – The Guardian
caCatalà
×