
Zhang S, Ding S, Cui W, Li X, Wei J, Wu Y. Evaluating the effectiveness of a clinical decision support system (AI-Antidelirium) to improve Nurses' adherence to delirium guidelines in the intensive care unit. Intensive Crit Care Nurs. 2025 Apr;87:103933. doi: 10.1016/j.iccn.2024.103933. Epub 2025 Jan 8. PMID: 39787945.
Question évaluée :
Un système d’aide à la décision clinique basé sur une intelligence artificielle (IA) peut-il augmenter le nombre d’interventions recommandées dans la prise en charge du délirium de réanimation et réalisées par les infirmières ?
Type d’étude :
Essai contrôlé randomisé en cluster (clusterisation des unités de soins).
Population étudiée :
Infirmières de 6 unités de soins intensifs (USI) (2 USI chirurgicales, 2 USI respiratoires et 2 USI cardiaques) dans 2 hôpitaux en Chine, présentant les critères d’inclusion suivants : au minimum un an d’expérience dans l’unité, y travaillant à temps plein et consentant à participer à l’étude. Ont été exclus les infirmières cadres de santé et formatrices.
Méthode :
Interventions :
Les infirmières du groupe d’interventions ont utilisé un système d’aide à la décision clinique (AI-Anti-Delirium) comprenant 4 éléments principaux :
l'évaluation du delirium, fonctionnant comme un instrument de dépistage facilité par le système (basé sur le CAM-ICU)
l'évaluation des facteurs de risque de delirium, (basé sur les facteurs de risque des directives PADIS (1) et la règle de prédiction du délirium DYNAMIC-ICU (2)
la proposition d’interventions en accord avec les directives PADIS
la proposition d’une liste d’activités de soins, pour une prise en soins individualisée.
Les infirmières du groupe témoin ont réalisé des évaluations sur papier pour le délirium (CAM-ICU) et les facteurs de risque, et ont mis en œuvre un ensemble d’interventions groupées basées sur la directive PADIS.
Critères de jugement :
Le critère de jugement principal était le taux d’observance des interventions réalisées pour prévenir le délirium (proportion d’interventions terminées par rapport au total des interventions attendues) chez les patients.
Les critères de jugement secondaires étaient l’observance de l’évaluation des facteurs de risque et de l’évaluation du délirium, ainsi que l’évaluation de la charge cognitive (intrinsèque, extrinsèque et générative) ressentie par les infirmières.
Randomisation :
6 unités ont été identifiées puis randomisées par un statisticien en aveugle
Calcul d’effectif :
Sur la base d’une étude similaire antérieure, il était prévu un taux d’observance de 80 % chez les infirmières du groupe intervention et 50 % dans le groupe témoin, en considérant une corrélation intra-cluster de 0,00001. Avec une valeur P bilatérale à 0,05 et une puissance de 80 %, au moins 13 infirmières dans chaque USI ont été nécessaires.
Résultats essentiels :
Entre novembre 2022 et juin 2023, 38 infirmières (87% de femmes, âgées de 33 ans en moyenne) ont été inclues dans le bras intervention, et 42 (93% de femmes, âgées de 34 ans en moyenne) ont été inclues dans le bras contrôle.
Principal : L’observance des actions contre le délirium était plus élevée dans le groupe intervention (75 %) que dans le groupe témoin (58 %) avec une différence statistiquement significative (P < 0,001).
Secondaires : L’observance des facteurs de risque et l’évaluation du délirium entre les groupes ne montre pas de différence statistiquement significative (respectivement P = 0,097 et P = 0,983). Aucune variation n’a été identifiée en ce qui concerne la charge cognitive globale (P = 0,083) et la charge cognitive intrinsèque (P = 0,646). Cependant, par rapport au groupe témoin, la charge cognitive extrinsèque dans le groupe intervention a démontré une réduction significative (P < 0,001) et la charge cognitive « germane » [FC1] ou essentielle au sein du groupe intervention a augmenté de manière significative (P < 0,001).
Commentaires :
Cette étude met en avant qu’un système d’aide à la décision clinique permettrait aux infirmières d’être plus observantes des interventions groupées nécessaires à la prise en charge du délirium. Toutefois, elle ne permet pas de conclure à un bénéfice sur la charge cognitive des infirmières ni sur la prise en charge des patients[FC2] . Elle fournit seulement des premiers éléments mesurés pour une prochaine étude.
Pour bien comprendre les résultats, la charge cognitive comprend trois composantes distinctes : la charge intrinsèque liée à la complexité de la tâche, la charge extrinsèque liée à la présentation ou à la conception de l’information, et la charge « germane » liée à l’effort mental investi pour apprendre et comprendre (3). Une augmentation de cette dernière composante, serait en faveur d’un apprentissage des infirmières malgré l’utilisation de l’outil.
Le terme "intelligence artificielle" désigne un ensemble très large de méthodes et de technologies visant à permettre à des machines d’imiter des fonctions humaines comme la résolution de problèmes, l’apprentissage ou la prise de décision. Il est souvent utilisé de façon générique ou à la mode pour qualifier ces divers processus automatisés (4). Dans l’étude, l’outil AI-Anti-Delirium a été développée en version test sur données simulées permettant à la machine de comprendre des interventions humaines (basé sur l’ingénierie des facteurs humain) (5), puis la version définitive utilisée dans l’étude a été améliorée pour permettre à la machine de chercher automatiquement les données dans les dossiers patients afin d’établir automatiquement les scores voulus et de générer des interventions humaines selon ces scores.
Des limites méthodologiques sont à prendre en compte dans l’interprétation des résultats. Le critère principal n’est pas évalué de la même façon dans les deux bras, ce qui peut entrainer un biais de mesure. En effet, l’observance des interventions réalisées pour prévenir le délirium est un taux (proportion d’interventions terminées par rapport au total des interventions attendues), or les interventions attendues sont définies par le logiciel dans le bras intervention et par les infirmières dans le bras contrôle. Cet élément est détaillé dans les suppléments (table 1).
Points forts :
Le schéma en cluster avec randomisation est un élément de robustesse de l’étude.
Bien que réalisée qu’en « intention de traiter », l’analyse a été conduite en multivariée, tout en considérant les mesures répétées, ce qui apporte une fiabilité aux résultats.
Les résultats d’une revue systématique sur les systèmes d’aide à la décision clinique et le rendement des soins infirmiers publiée en 2021, vont dans le même sens que les conclusions de cet article. La revue systématique indiquait que les systèmes d’aide à la décision clinique peuvent potentiellement améliorer l’observance des infirmières quant à certaines activités de soins comme la désinfection des mains (6).
Points faibles :
Un risque de contamination parmi les infirmières participant à l’étude, en particulier celles des unités de USI d’intervention et de contrôle du même hôpital, qui pourraient communiquer sur l’étude pendant leur temps libre, même si une formation leur a été donnée.
Un biais de mesure induit par la mesure différente selon les bras du critère de jugement (détail dans « Commentaires »).
Implications et conclusions :
Les résultats de l’étude, en accord avec ceux d’une revue systématique, semblent en faveur de l’usage d’un système d’aide à la décision clinique, processus automatisé (ou IA), qui permettrait de réaliser plus d’actions de prise en charge et prévention du délirium. Le critère de sélection des infirmières ayant un an d’ancienneté, à temps plein dans le service est important à garder en tête. Si les deux groupes sont comparables vis-à-vis de ce critère, l’étude porte tout de même sur une population aguerrie aux soins de réanimation, la question de recherche reste donc entière sur des jeunes recrues.
Une attention est aussi à porter sur le processus automatisés (ou IA), ce qui est généralement valable pour l’ensemble des processus automatisés. Si les tâches routinières et répétitives, comme la surveillance, sont susceptibles d’être facilement automatisées (7), une semi-expertise est souvent requise, les biais algorithmiques, la qualité des données vont conditionner la qualité des propositions de l’IA, ce qui nécessite une supervision humaine (8). Ici l’ancienneté des infirmières est cette expertise. Les infirmières ont donc de longs jours devant elles avant d’être remplacées par l’IA.
Une prochaine étude pourrait s’intéresser à mesurer la charge cognitive et plus particulièrement la charge générative, dont les premiers éléments décrivent une augmentation lors de l’usage d’une IA.
Références cités dans les commentaires :
- Devlin JW, Skrobik Y, Gélinas C, Needham DM, Slooter AJC, Pandharipande PP, et al. Clinical Practice Guidelines for the Prevention and Management of Pain, Agitation/Sedation, Delirium, Immobility, and Sleep Disruption in Adult Patients in the ICU. Crit Care Med. sept 2018;46(9):e825‑73.
- Fan H, Ji M, Huang J, Yue P, Yang X, Wang C, et al. Development and validation of a dynamic delirium prediction rule in patients admitted to the Intensive Care Units (DYNAMIC-ICU): A prospective cohort study. Int J Nurs Stud. mai 2019;93:64‑73.
- Pappas C. Cognitive Load Theory And Instructional Design [Internet]. eLearning Industry. 2014 [cité 23 mai 2025]. Disponible sur: https://elearningindustry.com/cognitive-load-theory-and-instructional-design
- Wang P. On Defining Artificial Intelligence. J Artif Gen Intell. 2019;10:1‑37.
- Salvemini AV. Improving the human-computer interface: a human factors engineering approach. MD Comput Comput Med Pract. 1998;15(5):311‑5.
- Mebrahtu TF, Skyrme S, Randell R, Keenan AM, Bloor K, Yang H, et al. Effects of computerised clinical decision support systems (CDSS) on nursing and allied health professional performance and patient outcomes: a systematic review of experimental and observational studies. BMJ Open. 15 déc 2021;11(12):e053886.
- Pepito JA, Locsin R. Can nurses remain relevant in a technologically advanced future? Int J Nurs Sci. 2018;6:106‑10.
- Mohanasundari S, Kalpana M, Madhusudhan U, Vasanthkumar K, B R, Singh R, et al. Can Artificial Intelligence Replace the Unique Nursing Role? Cureus [Internet]. 2023 [cité 13 mai 2025];15. Disponible sur: https://consensus.app/papers/can-artificial-intelligence-replace-the-unique-nursing-mohanasundari-kalpana/8a1af3d12176589687948daedb8d6e57/
CONFLIT D'INTÉRÊTS
Article Commenté par Fanny CROZES, RN, PhDs, Institut de Soins Infirmiers Toulouse, CHU de Toulouse, EQUITY team CERPOP, INSERM UMR 1295 Toulouse, France.
Le contenu des fiches REACTU traduit la position de leurs auteurs, mais n’engage ni la CERC ni la SRLF.
Voir la déclaration de conflits d'intérêt : Fanny Crozes
Envoyez vos commentaires/réactions à : Crozes.f@chu-toulouse.fr ou à la CERC.
CERC
G. LABRO (Secrétaire)
S. BOURCIER
A. BRUYNEEL
A.CAILLET
C. DUPUIS
N. FAGE
JP. FRAT
G. FOSSAT
A. GAILLET
S. GENDREAU
S. GOURSAUD
N. HIMER
O. LESIEUR
A. ROUZÉ
M. THY