STRATÉGIE & MANAGEMENT Stratégies & Management

Epidémie : la profusion des statistiques masque les vraies questions

https://player.vimeo.com/video/415933670 Olivier-Sibony-Epidemie-la-profusion-des-statistiques-masque-les-vraies-questions-306347044.jpg

Olivier Sibony

- Professeur affilié à HEC

Olivier Sibony

- Professeur affilié à HEC

Voir plus tard

Commenter

Imprimer

Depuis des semaines, nous scrutons tous les jours les données qui nous indiquent la progression de la pandémie de Covid-19. Des sites spécialisés sont apparus, montés par des universités, des médias, ou des agences de presse, qui compilent les données publiées par les autorités de santé du monde entier. On peut y trouver tous les chiffres possibles et imaginables sur l’épidémie : nombre de décès, de cas, de tests ; quotidiens ou cumulés ; en valeurs instantanées ou lissées sur plusieurs jours ; rapportés à la population ou ramenés à la date de démarrage de l’épidémie…. Bref, nous avons, dans cette crise sans précédent, une profusion sans précédent de données. Tous les grands médias internationaux rivalisent d’ingéniosité pour en faciliter l’accès et la visualisation.

Le danger de cette profusion de données, c’est qu’elle nous conduit à oublier une distinction fondamentale : celle entre les données disponibles et les informations nécessaires.

Pour l’illustrer, arrêtons-nous un instant sur un exemple typique de ces analyses comparatives, emprunté à The Economist (mais tout autre média de qualité aurait fait l’affaire). On voit sur ce tableau, une comparaison de l’évolution du nombre de cas confirmés dans différents pays. Les chiffres sont des moyennes mobiles sur sept jours, rapportées à la population, et les seize pays sont regroupés de manière à permettre une comparaison facile sur les mêmes échelles. Rien à redire, donc, sur la représentation des données.

Rien à redire, non plus, sur la rigueur intellectuelle de The Economist, qui ne manque pas de rappeler les limites de ces données : « les pays peuvent avoir adopté des politiques de test très différentes ». A la date de ce graphique, l’Allemagne a testé cinq fois plus de personnes que le Royaume-Uni. C’est évidemment un énorme problème : même si on en est conscient, les limites des données disponibles sont souvent tellement importantes qu’elles rendent toute conclusion hasardeuse. Quand ce qu’on a sous la main est très inexact, « faire avec ce qu’on a » peut être pire que ne rien faire du tout.

Car, même quand nous connaissons les limites des données, nous ne pouvons pas nous empêcher d’en tirer des conclusions. Une fois que nous avons ces chiffres sous les yeux, surtout s’ils sont représentés graphiquement d’une manière aussi éloquente, nous construisons immédiatement une histoire qui leur donne du sens.

Dans ce raisonnement, on reconnaît le biais de disponibilité : nous partons des données disponibles pour en tirer une conclusion. Le risque, c’est celui que résume la blague de l’homme qui a perdu ses clés et qui les cherche, la nuit, sous le faisceau d’un réverbère : au passant qui lui demande s’il est sûr de les avoir perdues là, il répond « non – mais c’est là qu’il y a de la lumière ».

Pour échapper au biais de disponibilité, nous devons adopter la démarche inverse, une démarche de résolution de problème : ne pas commencer par étudier les données disponibles, mais par définir la question à laquelle nous voulons répondre, et aller ensuite chercher les informations pertinentes pour cela.

Regardons ce que font, par exemple, les épidémiologistes de l’Institut Pasteur dans leur étude publiée le 20 avril. Ils ne se précipitent pas sur la courbe des cas en Belgique ou en Nouvelle-Zélande. Mais ils commencent par poser une question : quelle va être la progression de l’épidémie en France ? Puis ils décomposent cette question en construisant un modèle, qui prend en compte le nombre de personnes déjà touchées, la vitesse de propagation de l’épidémie, et ainsi de suite. En déroulant ce raisonnement, ils identifient les données clés qui leur manquent. Toutes ne sont pas disponibles : ils vont alors les chercher, ou les estimer. Par exemple, pour estimer le taux de mortalité de la maladie, ils vont s’appuyer, entre autres, sur l’échantillon des passagers du paquebot Diamond-Princess, qui est à cette date l’une des rares populations à avoir été entièrement testées.

Une vraie démarche de résolution de problème a un autre avantage : elle permet d’identifier plus vite les informations manquantes. Le statisticien John Ioannidis a ainsi été parmi les premiers, dès le 17 mars, à attirer l’attention sur l’absence d’une donnée essentielle : la part de la population été touchée par l’infection mais non diagnostiquée. Pour la connaître, expliquait Ioannidis, il faut impérativement réaliser des tests sérologiques sur de larges échantillons de population, qui permettent de mesurer quelle part de la population a développé des anticorps. C’est ce type d’étude qui est maintenant en cours, notamment à grande échelle en Allemagne.

Les journalistes – et a fortiori leurs simples lecteurs que nous sommes – ne sont pas des chercheurs. On ne leur demande pas, bien sûr, de bâtir des modèles épidémiologiques. Mais quand nous prenons des décisions importantes, nous pouvons tous nous efforcer d’éviter le piège du journalisme, et d’adopter la démarche du chercheur : plutôt que de nous précipiter sur les données disponibles pour essayer de leur trouver un sens, commencer par nous poser la bonne question, avant d’aller lui chercher des réponses.

Publié le lundi 18 mai 2020 . 5 min. 41

Mots clés : Economie
Idées & débats
Santé : Services et industrie
Statistique
Données
Information
Test
Epidémie
Covid-19

Téléchargez l'application

Les dernières vidéos
Économie générale

ÉCONOMIE Quelle bifurcation du capitalisme ? Olivier Passet 23/07/2024

Olivier-Passet-Quelle-bifurcation-du-capitalisme--306350435.jpg