
Dupont, T., Kentish-Barnes, N., Pochard, F. et al. Prediction of post-traumatic stress disorder in family members of ICU patients: a machine learning approach. Intensive Care Med 50, 114–124 (2024)
Question évaluée
Quel est l’apport des modèles d’apprentissage automatique pour la détection de PTSD (troubles du stress post-traumatique) chez les proches de patients hospitalisés en réanimation ?
Type d’étude
Développement de plusieurs modèles d’apprentissage automatique à partir d’une base de données issue d’études déjà réalisées pour la détection du PTSD.
Population étudiée
Les proches de patients hospitalisés dans un service de réanimation
Méthode
Utilisation d’une base de données intégrant 9 études cliniques (de mars 2003 à octobre 2020) issues du groupe de travail FAMIREA.
Elle comporte des données épidémiologiques, démographiques et médicales de patients hospitalisés en réanimation ainsi que leurs proches. Ces données ont été anonymisées et l’ensemble de ces études ont reçu, lors de leur réalisation, une approbation par un IRB.
Il est possible d’identifier, dans cette base de données, les proches ayant présenté un PTSD à partir d’échelles spécifiques (échelles IES, impact of event) sur une évaluation faite majoritairement au 90ème jour de la sortie de réanimation.
L’étude a été réalisée en s’appuyant sur les recommandations TRIPOD (1) (étude établissant des recommandations sur les modalités de développement de modèles de prédiction à des fins diagnostic ou pronostic)
De façon simplifiée la base de données a été divisée en deux parties : l’une servant à la formation des algorithmes (base d’entrainement) et l’autre aux tests de validation (base test). Seize covariables d’intérêt ont été sélectionnées pour former les modèles d’apprentissage automatique. Sept modèles de classification utilisant des techniques d’apprentissage automatique différentes ont été réalisés. La performance de chacun de ces modèles a ensuite été testé sur la base test.
Un système SHAP (2) a été utilisé pour illustrer la contribution de chacune des variables étudiées et donne une représentation graphique de leur influence respective.
Résultats essentiels
Sur 4591 proches issues de la base de données, 2734 ont été inclus dans l’étude car présentant à J90 une évaluation du PTSD. Au total, 33,5% des proches inclus présentaient un PTSD (916/2734).
En analyse univariée, le PTSD était associé aux situations suivantes : les proches de patients jeunes (âge médian du patient : 66 [IQR :55-76] versus 68 [59-77]), les patients présentant un cancer, un plus long séjour en réanimation (7.4 jours [4.7-15] versus 6.5 [4.7-12], un recours plus fréquent à la ventilation mécanique, et le décès en réanimation (76.7% versus 66.3%). La présence d’un(e) psychologue attaché(e) au service était moins fréquente chez les proches ayant présenté un PTSD.
Avec les modèles d’apprentissage automatique :
Les résultats sont hétérogènes selon le type de modèle avec une meilleure performance pour un modèle non linéaire : le XGBoost (AUC : 0.73 [0.69-0.78]).
Avec ce modèle, le PTSD était associé aux situations suivantes :
Le jeune âge du patient, la durée plus longue du séjour en réanimation, le recours à une ventilation mécanique, le sexe féminin du parent et son jeune âge, le fait que le parent soit un conjoint ou un enfant du patient, et le décès du patient en réanimation.
Dans une représentation de l’effet cumulatif des différents facteurs associés à une probabilité élevée de faire un PTSD, il est retrouvé : l'âge du patient, le fait d'être un conjoint ou un enfant du patient, le sexe du parent, le décès du patient en soins intensifs, l'âge du parent, les antécédents de cancer du patient, et la durée du séjour en réanimation.
Commentaires
C’est une étude clé pour plusieurs raisons : En premier lieu, elle apporte des résultats significatifs permettant de mieux identifier les facteurs de risques de PTSD chez les proches de patients hospitalisés en réanimation. L’autre raison est son originalité par sa forme. L’utilisation de modèles d’apprentissage automatique ouvre une porte, dans le domaine de la recherche, qui apporte des perspectives encore difficilement quantifiables mais vraisemblablement prometteuses.
Pour le fond il faut retenir que les facteur identifiés sont en grande partie des variables non modifiables. L’urgence est donc à l’identification des proches à risque afin de pouvoir leur proposer, selon des stratégies restant à déterminer, des modalités de prise en charge.
Les nombreux travaux de l’équipe FAMIREA dans la prise en charge des proches sont majeurs et vont s’accompagner d’études en cours sur des outils d’identification des sujets à risque.
Pour la forme, l’utilisation de modèles d’apprentissage automatique ouvre une voie nouvelle à la recherche dans tous les secteurs médicaux et, a fortiori, en réanimation. Il est certain que ce type d’études, novatrices par leur dessin, va aller en augmentant. L’absence de formation sur le fonctionnement de l’IA et notamment sur les différents modèles, rend impérieuse la mise en place de formation des équipes médicales afin de mieux maitriser cette nouvelle discipline. Le risque serait, par défaut de connaissances, de ne pouvoir élaborer une critique scientifique sur ce type d’études à venir.
Points forts
- Chiffre impressionnant d’une prévalence de 33% de PTSD chez les proches de patients hospitalisés en réanimation.
- Utilisation d’une nouvelle approche en recherche par des modèles d’apprentissage automatique.
- Mise en lumière des capacités prédictives de l'apprentissage automatique, l'influence des prédicteurs non modifiables et l'impact des caractéristiques du patient et de la famille sur le développement du PTSD.
- Intégration d’un système d’explicabilité permettant aux cliniciens de mieux appréhender les résultats fournis par les algorithme même si le sujet de l’explicabilité reste encore sujet à controverse (3).
- Renforcement de cette compréhension par deux très belles figures résumant bien les facteurs majeurs impliqués dans le risque de développement d’un PTSD.
Points faibles
- Question de l’universalisation des résultats. Les bases de données sont propres à cette équipe et cela interroge de facto sur la possibilité d’utiliser l’algorithme entrainé dans une population différente (pays, culture par exemple) Cette question aborde le sujet plus général de l’origine de la base de données servant à concevoir l’algorithme mais aussi sa qualité (comment les données ont été recueillies par exemple)
- La construction de l’algorithme se fait sur des données structurées (ici issues d’études préalables). Il existe de nouveaux modèles pouvant exploiter des données non structurées (toutes données pouvant exister au sein de différentes sources – notes médicales, paramédicales, etc.). Ce type de modèles, très puissants, pourrait être envisagé pour des études futures.
- Pouvant paraitre futile de prime-abord, il est probable qu’à l’avenir, une transparence sur la consommation énergétique nécessaire à l’apprentissage d’un algorithme, soit exigée. De plus en plus d’équipes publient l’empreinte carbone imputable au travail de recherche, notamment pour l’apprentissage des différents modèles(4). Cette donnée n’est pas présente dans l’étude.
Implications et conclusions
Le PTSD est fréquent chez les proches de patients hospitalisés en réanimation. Cette étude permet d’identifier un certain nombre de facteurs associés au risque de développer un PTSD. Le développement d’un algorithme par apprentissage automatique permet de mieux isoler ces facteurs de risque tout en apportant une explicabilité indispensable pour les cliniciens. Ce type d’approche ouvre des portes sur de nouveaux modèles de recherches imposant de penser différemment. Il est urgent de former les cliniciens à ce type d’approche afin de leur fournir les outils nécessaires à leur compréhension et donc leur critique.
Références cités dans les commentaires :
1. Collins GS, Reitsma JB, Altman DG, Moons KGM. Transparent Reporting of a multivariable prediction model for Individual Prognosis Or Diagnosis (TRIPOD): The TRIPOD Statement. Ann Intern Med. 2015;162(1):55‑63.
2. Lundberg SM, Erion GG, Lee SI. Consistent Individualized Feature Attribution for Tree Ensembles. arXiv; 2019. Disponible sur: http://arxiv.org/abs/1802.03888
3. Nagendran M, Festor P, Komorowski M, Gordon AC, Faisal AA. Quantifying the impact of AI recommendations with explanations on prescription decision making. npj Digit Med. 2023;6(1):206.
4. Lannelongue L, Grealey J, Inouye M. Green Algorithms: Quantifying the Carbon Footprint of Computation. Advanced Science. 2021;8(12):2100707.
CONFLIT D'INTÉRÊTS
Commenté par Cyril Goulenok, Service de Médecine Intensive Réanimation, Hôpital Privé Jacques Cartier, Massy.
L'auteur ne déclare pas de conflit d'intérêt en lien avec cet article.
Le contenu des fiches REACTU traduit la position des auteurs, mais n’engage ni la CERC ni la SRLF.
Envoyez vos commentaires/réactions à l'auteur (cyril.goulenok@gmail.com) et à la CERC.
CERC
G. LABRO (Secrétaire)
S. BOURCIER
A. BRUYNEEL
C. DUPUIS
S. GENDREAU
S. GOURSAUD
G. FOSSAT
N. HIMER
T. KAMEL
O. LESIEUR
A. ROUZÉ
V. ZINZONI