SOFA 2.0 : on répare et ça repart ?

20/03/2026

Auteur(s)

Texte

Ranzani OT, Singer M, Salluh JIF, Shankar-Hari M, Pilcher D, Berger-Estilita J, Coopersmith CM, Juffermans NP, Laffey J, Reinikainen M, Neto AS, Tavares M, Timsit JF, Arias Lopez MDP, Arulkumaran N, Aryal D, Azoulay E, Celi LA, Chaudhuri D, De Lange D, De Waele J, Dos Santos CC, Du B, Einav S, Engelbrecht T, Fazla F, Ferrer R, Finazzi S, Fujii T, Gershengorn HB, Greene JD, Haniffa R, Hao S, Hasan MS, Hollenberg S, Ippolito M, Jung C, Kirov M, Kobari S, Lakbar I, Lipman J, Liu V, Liu X, Lobo SM, Magatti D, Martin GS, Metnitz B, Metnitz P, Myatra SN, Oczkowski S, Paiva JA, Paruk F, Pekkarinen PT, Piquilloud L, Pölkki A, Prescott HC, Blaser AR, Rezende E, Robba C, Rochwerg B, Ruckly S, Samei R, Schenck EJ, Secombe P, Sendagire C, Siaw-Frimpong M, Simpkin AJ, Soares M, Summers C, Szczeklik W, Takala J, Tanaka S, Tricella G, Vincent JL, Wendon J, Zampieri FG, Rhodes A, Moreno R. Development and Validation of the Sequential Organ Failure Assessment (SOFA)-2 Score. JAMA. 2025 Dec 16;334(23):2090-2103. doi: 10.1001/jama.2025.20516. PMID: 41159833; PMCID: PMC12573119.

Lien

Consulter l'article !

Question évaluée :

Le score Sequential Organ Failure Assessment (SOFA) est un outil standardisé de description des défaillances d’organes et de leur sévérité, développé il y a trente ans [1] et largement utilisé à travers le monde (7700 références Pubmed). Il intègre six défaillances d’organes (cardiovasculaire, respiratoire, neurologique, rénale, hépatique et hématologique), chacune cotée par ordre de sévérité croissante de 0 à 4. Cette étude en propose une réévaluation et une mise à jour afin de tenir compte de l’évolution des pratiques en réanimation.

Type d’étude :

Etude de développement et de validation d’un score de dysfonction d’organes.

Population étudiée :

Patients de plus de 18 ans admis en réanimation entre janvier 2014 et décembre 2023 et issus de 10 cohortes.

Méthode :

Le développement et la validation du score se sont déroulés en huit étapes successives.

Les cinq premières ont été détaillées dans une publication antérieure [2]. Elles ont permis d’aboutir à une première version du score à partir d’un consensus de soixante experts et d’une revue systématique de la littérature. Cette première version proposait huit défaillances (les 6 défaillances de SOFA-1 plus les défaillances digestive et immunologique).

La présente publication se concentre sur les trois dernières étapes de développement du score :

Etape 6 : analyse de validité interne, étudiant pour chaque variable candidate sa distribution, les seuils à utiliser pour la grader (modèles type arbre de régression et de classification) et sa performance pour la prédiction de la mortalité en réanimation.
Etape 7 : validation par consensus d’experts.
Étape 8 : validation externe, vérifiant la performance prédictive pour la mortalité en réanimation ainsi que la robustesse des résultats sur des analyses de sensibilité, testant différentes stratégies de gestion des données manquantes.

Résultats essentiels :

L’analyse a porté sur huit registres nationaux et deux bases de données multicentriques, intéressant au total 3,3 millions de patients admis dans 1319 réanimations dans neuf pays dont la France. Les patients étaient admis en majorité pour un motif médical. La mortalité globale en réanimation était de 8%. Le calcul complet du score était possible pour environ 1 million de patients, dont 100.000 patients décédés.

Validité interne

L’analyse de validité interne a porté sur quatre cohortes incluant environ 2,1 millions de patients. Les valeurs seuils obtenues par modélisation statistique étaient proches de celles proposées par le consensus d’experts.

Exclusion des défaillances digestive et immunologique

La défaillance digestive (représentée par la survenue d’une hémorragie digestive et la mesure de la pression intra-abdominale) n’a pas été incluse dans le score final du fait d’un nombre élevé de données manquantes et d’une absence d’association à la mortalité en réanimation.

La défaillance immunologique (représentée par le taux de lymphocytes et de leucocytes totaux) était associée à la mortalité en réanimation. Elle n’a pas été retenue par manque de validité de contenu, les experts ayant estimé que les variables quantitatives proposées ne pouvaient pas se substituer aux tests fonctionnels, non disponibles en pratique clinique.

Version finale du score

Elle est détaillée dans la publication. Les principales évolutions de SOFA-2 concernent l’intégration :

Du delirium pour définir la défaillance neurologique,
De l’oxygénothérapie à haut débit, de la ventilation non invasive et de l’ECMO pour définir la défaillance respiratoire et sa sévérité,
Des doses cumulées de catécholamines, des nouveaux vasopresseurs et d’inotropes pour grader la défaillance hémodynamique,
De l’épuration extrarénale (ou la présence de critères théoriques d’épuration extrarénale) pour définir la défaillance rénale.

Une stratégie explicite de gestion des données manquantes a été utilisée, basée sur l’hypothèse qu’une donnée est absente parce qu’elle n’a pas nécessité d’être mesurée : soit le patient ne présente pas la défaillance considérée (imputation d’une valeur normale en l’absence de donnée antérieure), soit son état n’a pas évolué (imputation de la dernière valeur disponible).

Validité externe

L’analyse de validité externe a porté sur six cohortes incluant environ 1,2 millions de patients, comparables aux patients des cohortes de validation interne.

Le SOFA médian était de 6 [4-9] à J1 et de 5 [3-8] à J3. L’évolution temporelle était différente pour chaque variable candidate.

L’augmentation d’un point du SOFA-2 était associée à une augmentation de 38% de la mortalité en réanimation (OR 1,38 [1.37-1.38]).

50% des patients avaient un SOFA-2 différent de leur SOFA-1. Le SOFA-2 était plus élevé pour 10% des patients (différence de 2 [1-3] points), et plus bas pour les 40% restants (différence de 3 [1-4] points). Les reclassements avaient surtout lieu pour les défaillances cardiovasculaire, respiratoire et rénale, vers des scores plus bas ou intermédiaires (entre 0 et 2).

La validité prédictive pour la mortalité en réanimation était similaire entre le SOFA-2 (AUC 0.81 [0.81-0.81]) et le SOFA-1 (AUC 0.80 [0.79-0.80]). La meilleure AUC était obtenue pour le SOFA-2 moyen sur l’ensemble du séjour.

Les analyses de sensibilité montraient une mortalité plus élevée lorsque le score complet était calculable, avec une validité externe similaire entre les différentes méthodes d’imputation.

Commentaires :

Le SOFA est avant tout un outil de description de la sévérité des défaillances d’organes, plutôt qu’un outil de prédiction de la mortalité, contrairement à d’autres scores de réanimation (APACHE ou IGS) [1].

Le SOFA-2 prend en compte de nombreuses évolutions des pratiques : utilisation de techniques non invasives de ventilation, de nouveaux vasopresseurs… Le SOFA-2 est ainsi différent du SOFA-1 pour plus de la moitié des patients, et plus bas que le SOFA-1 pour la plupart d’entre eux. Le pouvoir prédictif pour la mortalité en réanimation est élevé, comparable à celui du SOFA-1.

Le score complet n’était calculable sans donnée manquante que pour environ 30% des patients, indiquant une utilisation des sous-scores plutôt que du score complet. La stratégie d’imputation des données manquantes utilisée repose sur une hypothèse clinique solide mais limite la robustesse des résultats.

Comme le SOFA-1, le SOFA-2 fait l’hypothèse d’une augmentation linéaire de gravité entre chaque point du score, mettant numériquement sur le même pied une augmentation de 15 à 25 µmol/L de la bilirubinémie et la mise sous ECMO, par exemple. De même, il fait l’hypothèse que la présence d’une défaillance grave (sous-score à 4) équivaut à la présence de deux défaillances modérées (deux sous-scores à 2).

L’existence de dysfonction chronique d’organes n’est pas prise en compte : un patient avec une insuffisance rénale aiguë de novo nécessitant une épuration extrarénale aura le même sous-score rénal qu’un patient en dialyse chronique.

Enfin, la faible mortalité en réanimation des cohortes utilisées (8%) et l’inclusion des patients sur une période longue (2014-2023), notamment dans le contexte de l’épidémie COVID sont à noter.

Points forts :

Très large population internationale, incluant des pays à ressources plus limitées.
Outil standardisé, reproductible, permettant une évaluation dynamique des défaillances d’organes.
Bonne prédiction pour la mortalité en réanimation, comparable à celle du SOFA-1.

Points faibles :

Non prise en compte des défaillances digestive et immunologique.
Hypothèse d’une augmentation linéaire de la sévérité clinique par point de SOFA.
Non prise en compte de dysfonctions d’organes préexistantes.
Imputation de nombreuses données manquantes pour le calcul du score complet.

Implications et conclusions :

Le SOFA-2 constitue un outil standardisé et reproductible de description dynamique des défaillances d’organes en réanimation, adapté aux pratiques actuelles.

Cependant le SOFA-1 ne doit pas être oublié. D’une part, seul SOFA-1 fait partie de la définition actuelle du Sepsis. D’autre part, de nombreuses études en cours ont comme objectif la baisse de SOFA-1 dans le temps (J7 par ex).

SOFA-2 ne doit pas être utilisé comme un outil unique ou définitif, en particulier pour la prédiction de la mortalité des patients.

Références cités dans les commentaires :

Vincent JL, Moreno R, Takala J, et al. The SOFA (Sepsis-related Organ Failure Assessment) score to describe organ dysfunction/failure. On behalf of the Working Group on Sepsis-Related Problems of the European Society of Intensive Care Medicine. Intensive Care Med. 1996;22(7):707-710. doi:10.1007/BF01709751
Moreno R, Rhodes A, Ranzani O, et al. Rationale and Methodological Approach Underlying the Development of the Sequential Organ Failure Assessment (SOFA)-2 Score: A Consensus Statement. JAMA Netw Open. 2025;8(10):e2545040. Published 2025 Oct 1. doi:10.1001/jamanetworkopen.2025.45040

CONFLIT D'INTÉRÊTS

Commenté par Margot Combet et Jean-Paul Mira, Service de Médecine Intensive Réanimation, CHU Cochin Port-Royal. GHU APHP Centre

75014 Paris

Le contenu des fiches REACTU traduit la position de leurs auteurs, mais n’engage ni la CERC ni la SRLF.

Envoyez vos commentaires/réactions à la CERC.

CERC

G. LABRO (Secrétaire)
S. BOURCIER
A. BRUYNEEL
A.CAILLET
C. DUPUIS
N. FAGE
JP. FRAT
G. FOSSAT
A. GAILLET
S. GENDREAU
S. GOURSAUD
N. HIMER
O. LESIEUR
A. ROUZÉ
M. THY