A propos d'indicateurs
Lors de la première édition de ce billet : A propos d'indicateurs ou quand le Covid19 vient perturber l'activité, je profitais de l'occasion pour donner des éléments de réflexion quant à la documentation d'indicateurs et sur les moyennes calculées à partir de données réelles de statistiques personnelles relatives aux sorties cinéma et aux heures de suivi de Moocs.
Je n'ai pas mis à jour les graphiques, pour les explications ce n'est pas nécessaire. Ce sont des exemples de traitements de données.
Contexte du billet A propos d'indicateurs
Sur l'image partagée ci-dessus, vous avez le tableau de chiffres avec 3 solutions de traitement des données (1) (2) et (3) pour l'année 2020 compte tenu de la fermeture des salles et le graphique du nombre d'heures de suivi de Moocs par semaine (4), normalement non impacté par le Covid19 (pour un retraité j'entends).
Suite à la publication d'un tweet mettant en exergue la chute de la moyenne mensuelle du nombre de toiles, on m'a fait remarquer à bon escient qu'il n'aurait pas fallu indiquer 0 pour les mois d'avril et de mai afin de ne pas fausser le calcul de la moyenne, j'ai donné pour illustrer le propos les 2 autres solutions possibles de traitement, nous allons y revenir.
Pour le suivi du nombre d'heures de cours (4), on peut y distinguer des coupures correspondant aux vacances, mais ce choix est tout à fait arbitraire, mais a permis de prendre des moyennes par périodes.
Donc oui, pour le suivi des statistiques publiées sur ce blog (billet d'ailleurs pas mis à jour depuis février) il y avait déjà 2 modes de suivi mais compte tenu du choix mensuel ce n'est pas cette courbe qui était publiée mais l'extraction mensuelle du fichier de données.
En bas les statistiques minimum, moyenne, maximum et total permettent de comparer année par année et ce depuis le début du suivi donc avril 2012.
L'année correspondante n'étant pas pleine, le total n'a pas beaucoup de sens par rapport aux autres années.
Par ailleurs, le nombre de jours par mois n'étant pas uniforme, le comparatif dans chaque colonne n'a pas beaucoup de sens, par contre hors mois de février, par ligne ça a bien un sens.
Enfin le chois de suivi par semaine évite les biais dus au nombre de jour dans le mois ou aux années bissextiles.
Après on va pouvoir se demander une justification sur les évolutions.
Nota : un graphique permet de positionner visuellement le résultat par rapport aux objectifs et cibles, le tableau chiffré oblige à partir des données...
Les données sont brutes, au sens propre il n'y a pas de sorties au ciné par contre le total du nombre de sorties est bien le bon
On supprime les 0, car s'il n'y a pas eu de sorties c'est du fait de la fermeture des cinémas. Et en plus si l'abonnement a été suspendu, pour le calcul qui serait fait du coût par toile ce serait plus "juste".
Par contre, le mois de juin n'étant pas entier, le 5 n'a pas de sens non plus. Ce résultat est-il comparable à celui d'octobre 2012 ? Manifestement non, il faudrait là aussi retraiter ce résultat.
Petite règle de 3 pour ramener le chiffre sur 9 jours à ce qu'il aurait été sur 30 jours en "supposant" que c'est bien proportionnel.
Par contre avec ce résultat, le total annuel devient faux... Il n'y a pas encore eu 84 billets de cinéma édités !
Pour le comptable, pour vérifier le nombre de billets vendus, les données brutes ont bien un sens.
Pour expliquer les 2 "0" les supprimer évite justement de le faire et du coup la moyenne est juste et le total annuel aussi d'ailleurs.
Par contre, utiliser la 3ème solution pour expliquer le faible score de juin, c'est logique, mais faire rentrer ce chiffre dans les données est discutable (d'autant plus critiquable avec avec le total implicitement faux).
Ceci dit, l'important est bien de savoir pourquoi on suit et communique ces chiffres et à qui ?
Je ne pense pas que ce soit pour masquer la réalité. Il faut donc dissocier les données réelles des données retraitées et savoir expliquer le pourquoi (tout comme le comment) du retraitement.
Pour finir ce billet, nous avons évoqué le sujet sans vraiment dissocier reporting, indicateurs, données et retraitements, nous aurons donc l'occasion d'y revenir car c'est un sujet qui me tient à coeur.
Billet mis à jour par Louis CHATEL le 21/09/2023
Nota 1 : le mois de mars n'était pas complet non plus, le résultat 14 dans la dispersion (ce n'est pas le mini mais il aurait dû attirer l'attention) aurait fait oublier de corriger le chiffre. Pour l'anecdote le chiffre de 12 en juillet 2019 est bien un minimum... donc devrait être expliqué (une hospitalisation suivie d'un repos forcé au domicile permettant de le faire simplement).
Nota 2 : il ne faut pas vouloir tout faire faire à un même indicateur, sinon on va succomber au syndrome du couteau suisse
Pour le suivi du nombre d'heures de cours (4), on peut y distinguer des coupures correspondant aux vacances, mais ce choix est tout à fait arbitraire, mais a permis de prendre des moyennes par périodes.
Donc oui, pour le suivi des statistiques publiées sur ce blog (billet d'ailleurs pas mis à jour depuis février) il y avait déjà 2 modes de suivi mais compte tenu du choix mensuel ce n'est pas cette courbe qui était publiée mais l'extraction mensuelle du fichier de données.
Tableau de chiffres VS graphique
En première analyse de ces représentations de données, on peut remarquer.Tableau
Pour le tableau, les données ont été regroupées par années/mois de façon à pouvoir comparer les mois entre eux.En bas les statistiques minimum, moyenne, maximum et total permettent de comparer année par année et ce depuis le début du suivi donc avril 2012.
L'année correspondante n'étant pas pleine, le total n'a pas beaucoup de sens par rapport aux autres années.
Par ailleurs, le nombre de jours par mois n'étant pas uniforme, le comparatif dans chaque colonne n'a pas beaucoup de sens, par contre hors mois de février, par ligne ça a bien un sens.
Graphique
Pour le graphique, on visualise bien l'évolution, la moyenne par période permettant une synthèse visuelle...Enfin le chois de suivi par semaine évite les biais dus au nombre de jour dans le mois ou aux années bissextiles.
Après on va pouvoir se demander une justification sur les évolutions.
Nota : un graphique permet de positionner visuellement le résultat par rapport aux objectifs et cibles, le tableau chiffré oblige à partir des données...
Données réelles ou retraitées ?
Dans notre exemple de tableau de données, vous avez 3 solutions de retraitement.Aucun retraitement
Tableau version (1)Les données sont brutes, au sens propre il n'y a pas de sorties au ciné par contre le total du nombre de sorties est bien le bon
Correction du nombre de mois dans la moyenne
Tableau version (2)On supprime les 0, car s'il n'y a pas eu de sorties c'est du fait de la fermeture des cinémas. Et en plus si l'abonnement a été suspendu, pour le calcul qui serait fait du coût par toile ce serait plus "juste".
Par contre, le mois de juin n'étant pas entier, le 5 n'a pas de sens non plus. Ce résultat est-il comparable à celui d'octobre 2012 ? Manifestement non, il faudrait là aussi retraiter ce résultat.
Correction du chiffre de juin pour compenser le nombre de jours.
Tableau version (3)Petite règle de 3 pour ramener le chiffre sur 9 jours à ce qu'il aurait été sur 30 jours en "supposant" que c'est bien proportionnel.
Par contre avec ce résultat, le total annuel devient faux... Il n'y a pas encore eu 84 billets de cinéma édités !
En conclusion : connaître le but des données
On aurait dû commencer par là, quel est le but du suivi et quels en sont les destinataires ?Pour le comptable, pour vérifier le nombre de billets vendus, les données brutes ont bien un sens.
Pour expliquer les 2 "0" les supprimer évite justement de le faire et du coup la moyenne est juste et le total annuel aussi d'ailleurs.
Par contre, utiliser la 3ème solution pour expliquer le faible score de juin, c'est logique, mais faire rentrer ce chiffre dans les données est discutable (d'autant plus critiquable avec avec le total implicitement faux).
Ceci dit, l'important est bien de savoir pourquoi on suit et communique ces chiffres et à qui ?
Je ne pense pas que ce soit pour masquer la réalité. Il faut donc dissocier les données réelles des données retraitées et savoir expliquer le pourquoi (tout comme le comment) du retraitement.
Pour finir ce billet, nous avons évoqué le sujet sans vraiment dissocier reporting, indicateurs, données et retraitements, nous aurons donc l'occasion d'y revenir car c'est un sujet qui me tient à coeur.
Billet mis à jour par Louis CHATEL le 21/09/2023
Nota 1 : le mois de mars n'était pas complet non plus, le résultat 14 dans la dispersion (ce n'est pas le mini mais il aurait dû attirer l'attention) aurait fait oublier de corriger le chiffre. Pour l'anecdote le chiffre de 12 en juillet 2019 est bien un minimum... donc devrait être expliqué (une hospitalisation suivie d'un repos forcé au domicile permettant de le faire simplement).
Nota 2 : il ne faut pas vouloir tout faire faire à un même indicateur, sinon on va succomber au syndrome du couteau suisse
D'autres billets sur le sujet ? Consulter l'index de la catégorie "Management"
Commentaires
Enregistrer un commentaire