Pyjam a écrit :Absolument.
Première leçon de l'analyse de données : comprendre ce que représente les données que l'on a.
Calculer un taux de décès en divisant le nombre total de décès par le nombre de patients actuellement hospitalisés n'a pas tellement de sens. C'est un pourcentage qui ne peut aller qu'en s'accroissant et qui finira par dépasser les 100% (quand le nombre cumulé de décès dépasse le nombre d'hospitalisations courantes). D'ailleurs à la fin de l'épidémie ce taux tendra vers l'infini au fur et à mesure que le nombre d'hospitalisations tendra vers zéro.
En fait, tu cherches à faire un indicateur avec des données qui ne permettent pas grand chose.
On pourrait se dire qu'on va revoir le truc en considérant la formule suivante :
taux de décès = nombre de décès / (hospitalisés + décédés + sorties d'hôpital)
Ça semble un peu plus cohérente (et là les "taux de décès" sont quasiment divisés par deux).
Sauf que là aussi on a un problème : parmi la population hospitalisée, certains vont mourir. Les "morts à l'hôpital" de demain font partie des "hospitalisés" d'aujourd'hui. Et avec les seules données que l'on a ici, impossible de savoir quelle sera cette proportion.
Autre problème : on compare des données sur un phénomène qui n'a pas démarré à la même date dans les deux endroits. Voyons une autre source des mêmes données qui fourni quelques éléments supplémentaires (courbes d'évolution sur les 12-13 derniers jours, différences avec la veille, etc.)
Et je vais me permettre de faire aussi des "indicateurs". Tiens, regardons à quelle vitesse augmente le nombre de décès dans les deux départements considérés (Haut-Rhin et Bouches-du-Rhône), je vais calculer ça comme ça : décès du jour n/ cumul décès de n-1
Haut-Rhin : 32/(380-32) = 9,2%
Bouche-du-Rhône : 5/(35-5) = 16,7%
Houla ! Mais ça augmente nettement plus vite dans l'un que dans l'autre (même si le cumul y est, pour l'instant, nettement inférieur). Mais ça n'a pas de sens : le phénomène que j'étudie n'a pas démarré au même moment dans les deux endroits.
Note : Si on regarde d'autres courbes dans les deux départements, on verra par exemple que dans le Haut-Rhin le nombre d'hospitalisations n'augmente plus beaucoup (soit y a plus de place, soit il ne rentre pas beaucoup plus de gens qu'il n'en sort) mais le nombre de personne sorties continuent d'augmenter sensiblement. En Bouches-du-Rhône le nombre de personnes sorties stagne un peu ces derniers jours alors que le nombre d'hospitalisation continue d'augmenter fortement. Peut-on en conclure quelque chose ? (proposition d'explication sans fondement : le turn-over est plus élevé dans le Haut-Rhin, les patients restant moins longtemps à l'hôpital, mais ça pourrait être n'importe quoi d'autres).
Note 2 : les deux départements comptent plusieurs villes et plusieurs établissements de santé concernés par les chiffres en question. Peut-on tirer une conclusion concernant les agissements d'un praticien dans un établissement sur la base d'un cumul départemental ? (spoiler : non)
Bref, manipuler correctement des chiffres demande en premier lieu de les comprendre, de bien cerner ce qu'ils représentent et d'arriver à les associer de façon cohérente.