PRATIQUE MATH

Accueil du site > APPROCHE PAR COMPETENCE ET SOCLE COMMUN > QUELS REPERES DE SAVOIRS MATHEMATIQUES POUR LES ELEVES EN FIN DE SCOLARITE (...) > Gestion de données statistiques et aléatoires > LES STATISTIQUES

LES STATISTIQUES

dimanche 27 avril 2014, par Alfred Bartolucci


Dans les médias, les statistiques, c’est souvent des pourcentages ou des graphiques. Mais ce qu’on fait en classe, sans être compliqué c’est souvent très technique. Quel est l’intérêt de calculer la moyenne, des pourcentages, ... de faire toutes sortes de graphiques alors qu’ils sont donnés quand on en a besoin C’est quoi et à quoi ça sert les statistiques ? Est-ce vraiment des maths ?

Aux informations TV, les statistiques, c’est souvent des pourcentages ou des courbes à lire. Mais ce qu’on fait en classe, sans être compliqué c’est souvent embrouillé. Quel est l’intérêt de calculer la moyennes, la médiane, ... de faire toutes sortes de graphiques alors qu’ils sont donnés quand on en a besoin A ? quoi ça sert les statistiques ?

Quelques exemples pour illustrer divers usages des statistiques.

Régulièrement le grand public a accès, par divers médias, à une multitude d’informations statistiques. Voici quelques exemples :

  • Le nombre de blessés sur les routes a baissé de 9,2% de 2007 à 2008 en France.
  • En France 22,2 milliards de litres de lait sont produits chaque année.
  • … pour la France, l’espérance de vie a augmenté de trois mois sur une année.
  • Plus de 8 millions de téléspectateurs ont suivi la nouvelle émission de téléréalité samedi soir.
  • La population mondiale, de 6 milliards d’habitants en 1999, actuellement de 6,8 milliards, dépassera les 7,5 milliards en 2020 et les 9 milliards en 2050.

Tous ces messages résultent d’études statistiques. Celles-ci, pour les exemples cités ont été conduites par les services statistiques de diverses institutions reconnues. Les bases d’informations utilisées comme les modes de collectes de ces informations ainsi que l’ensemble des traitements qui constituent les études sont rarement et peu détaillés. C’est le message qui est sensé résumer l’étude qui est diffusé.

Les statistiques : une branche des mathématiques

Les statistiques constituent une branche des mathématiques orientée vers la gestion et le traitement de données. Certains des outils des statistiques sont spécifiques du domaine, sont d’usage familier (calcul de moyenne, de pourcentage, mise en tableau, représentation graphique, …). C’est surtout par les méthodes qui y sont utilisées que se définissent les statistiques. Ces dernières sont nombreuses et peuvent être très sophistiquées même si le scénario global suit souvent le schéma :

  • préoccupation, question
  • collecte de données (observation, inventaire, sélection ou enquête …,),
  • codage et traitement,
  • analyse et interprétation,
  • synthèse et diffusion …

Les méthodes et outils statistiques sont utilisés pour rendre compte, pour comprendre ou expliquer certains phénomènes qui apparaissent par observation et traitement d’un grand nombre de données disponibles ou collectées à cet effet.

Les statistiques un outil pour mettre en évidence des faits cachés

Pour un pays, une organisation, une entreprise l’appel aux statistiques a pour objectifs une meilleure connaissance de certains phénomènes ou de certaines évolutions. Par là, on dispose d’informations dont certaines sont des prévisions, le tout est très utile au pilotage, aux prises de décisions.
Ainsi, l’usage des statistiques, à différents niveaux d’activités humaines, a pour objectifs de contribuer à une plus grande cohérence des fonctionnements. De plus, notamment en sciences humaines (pratiques alimentaires et santé, comportements relatifs à la consommation), les méthodes des statistiques sont largement utilisées pour valider des hypothèses formulées dans le cadre d’études. En ce sens, les statistiques contribuent, dans tous ces cas au développement nouvelles connaissances.
Aujourd’hui, avec une montée en puissance ces dernières décennies notamment avec le développement de l’informatique, les outils et les méthodes statistiques sont répandus dans tous les secteurs d’activités. Les divers médias (télé, radio, presse) diffusent à destination du grand public très fréquemment des conclusions de diverses études sensés informer sur des situations ou des tendances. Ces éléments sont en réalité résumés sous forme très synthétique :

  • valeurs numériques isolées, tableaux de valeurs, rapports ou pourcentages ...
  • graphiques de comparaison, de répartition, d’évolution, ...
  • mises en formes spécifiques : listes, couleurs sur des cartes, formulation ramassée de type « slogan » ...

Aussi il convient d’être prudent à ne pas interpréter trop rapidement et de ce fait de façon déformée ce type de message constitué forcément d’une information tronquée. Il est essentiel de chercher à retrouver au moins certains éléments du contexte qui donne du sens au message reçu. C’est à ce prix qu’on évitera des contresens et qu’on repèrera des biais dans les commentaires qui peuvent accompagner ces messages.

Nécessité d’une attitude critique et distanciée

Pour souligner la nécessité d’une réception critique et distanciée de toute information statistique nous reprenons les exemples cités au début :

  • Une statistique sur l’évolution du nombre de blessés sur les routes résulte de comparaisons de données relevées nationalement, ici, en 2007 et en 2008. Si on admet que les relevés sont bien tenus et sur les mêmes bases alors l’annonce est fiable. Il faut cependant avoir conscience qu’une telle information est au service d’un projet politique, ici, tout à fait louable, qui veut amener la société française à prendre conscience de la nécessité d’une pratique de la route plus responsable.
  • On ne précise pas les années concernées par cette information sur la production laitière. Cela donne à supposer que 22,2 milliards de litres est une production moyenne et assez stable d’année en année … Mais quelle est la durée de cette stabilité si stabilité il y a : cinq ans, dix ans, … ? De plus, à supposer qu’une année donnée on ait une baisse de production de 50 millions de litres de lait, cela représenterait en pourcentage un écart de 0,2 soit 2 pour mille... et ne modifierait pas le score annoncé : 22,2 milliards de litres. Pourtant, cet infime écart d’un point de vue statistique et qui pourrait être considéré comme négligeable par des techniciens, représente la production annuelle de plus de 7000 vaches. A y regarder de plus près on pourrait découvrir plusieurs cessations d’activité de petits producteurs pour des raisons de difficultés économiques dramatiques.
  • Dans ce cas particulier l’information l’espérance de vie a augmenté de trois mois sur une année donnée par l’INSEE s’appuie sur des données de 2001. Cette information a été reprise sous la forme actuellement l’espérance de vie en France augmente de trois mois par an … par certains média. Cette reformulation laisse entendre que l’augmentation de 3 mois aurait lieu chaque année … ce que ne dit pas l’étude. La tentation à généraliser une information statistique particulière est fréquente, il convient d’être vigilant.
  • On peut être perplexe sur la possibilité à connaître qui regarde quoi à la télévision, Mais des techniques fiables existent ; elles sont mises en œuvre par des organismes chargés des mesures des audiences télé : un groupe de personne représentatif de l’ensemble de la population est équipé d’un boitier qui transmet à une centrale les horaires où la télé est allumée, la chaine choisie et le nombre de personnes qui la regardent. Ces informations sont prises en compte pour le calcul du prix des écrans publicitaires associés aux diverses émissions mais que recherche-t-on en les diffusant auprès du grand public ? En donnant les taux d’audience des émissions les plus populaires … on contribue ainsi à leur promotion. Des émissions de qualité mais qui se prêtent mal au jeu des pics de popularité vont rester dans l’ombre où même être refusées par les directeurs de programmes en quête d’audience et de recettes publicitaires. Ainsi, un mauvais usage des taux d’audience renforce un système au service de la recherche effrénée de complaisance envers les téléspectateurs avec pour conséquence une uniformisation des propositions aux plages de grande écoute sur les principales chaînes. Ce n’est pas l’outil « mesure des audiences » qui est nocif, c’est l’usage qu’on en fait. Comme pour tous les outils, les outils statistiques peuvent rendre de grands services mais aussi avoir des usages sombres
  • Dans le cas précédant on estimait des grandeurs réelles « le nombre de personnes regardant telle émission », dans ce dernier cas on réalise une prévision sur ce que sera la population mondiale en 2020.
    Des outils existent pour tenter de telles projections. Les paramètres à prendre en compte sont nombreux, il faut de plus tenir compte de tendances qui n’ont pas de caractère figé …, mais de tous ces éléments tous n’ont pas la même importance et c’est sur ce point qu’on fait les choix qui permettront d’établir la prévision. Toute information statistique communiquant une prévision est à considérer avec diverses précautions :
  • Quel est les auteurs (coordination de plusieurs équipes de recherches, groupe d’un laboratoire, …) ?
  • Quel est le contexte dans lequel apparaît l’information ?
  • Quels sont les commanditaires de l’étude (institutions internationales, organisme particulier, …) ?
  • Sur quels éléments de base ont été faits les divers traitements qui ont abouti à la prévision ? Quelle que soient ses garanties de fiabilité une prévision est une hypothèse de possible mais d’autres hypothèses existent qui sont aussi des possibles. L’intérêt des prévisions est d’envisager divers scénarios par anticipation et ainsi mieux s’adapter à ce arrivera. En statistiques on prévoit avec nécessairement des marges d’incertitudes mais on ne prédit pas. C’est une distinction essentielle à avoir en tête lors de la lecture d’informations prévisionnelles.

Comme l’illustrent les exemples qui précèdent les statistiques regroupent à la fois des méthodes et des outils de collecte et de traitement de données de natures diverses et ce pour des variétés de situations. Les analyses qui en en sont faites, souvent, mettent à jour des informations non apparentes et peuvent dans certains cas ouvrir à de nouveaux savoirs. Mais l’usage mal intentionné de ces informations ou ce qui arrive souvent, un usage mal informé peut conduire à diffuser des messages trompeurs voire des contre vérités.

Comprendre les statistiques en tant qu’acteur et citoyen responsable Chaque individu n’a pas être statisticien, mais chacun gagne à disposer des connaissances techniques de base pour lire les informations statistiques qui touchent à des aspects pratiques de la vie quotidienne mais aussi qui peuvent engager des choix de société. Sur ce dernier point, en plus que des aspects techniques de base (lecture et contrôle de pourcentages, de moyennes, de représentations graphiques, de commentaires faits sur ces données, …) il est nécessaire que chaque citoyen développe une vigilance à déjouer les implications cachées ou pire les manipulations. Une telle attitude responsable est en opposition avec une méfiance excessive qui serait un autre aspect d’un manque de sens critique.
En tant qu’élève, dans un collège donné, on peut avoir à donner des informations sur le fonctionnement des cars scolaires, sur la régularité de leurs horaires ; il est probable que les réponses collectées seront traitées pour envisager des aménagements en vue d’améliorations de leur fonctionnement. On peut aussi observer qu’au CDI, on relève le nombre de visites par tranche horaire ainsi que le type d’activité que chacun y conduit ; sans doute, l’enseignant documentaliste ou l’équipe pédagogique réfléchissent à des initiatives qui vont stimuler la fréquentation du CDI et diversifier les utilisations qu’en font les élèves. Mais dans les deux cas, si les adultes ne le font pas, il est essentiel de demander à être informé sur les raisons de ces collectes d’informations et sur l’utilisation qu’on prévoit d’en faire. Ce faisant, on exerce notre responsabilité de personne dans un collectif ce qui est une nécessité toute au long de la vie. Avec la facilité de collecte et de conservation de différentes données des systèmes administratifs pourraient être tenté de collecter des informations sur tout de façon à tout tenir et tout gérer : c’est la tentation de la toute puissance. Ce ne sont plus des statistiques pour agir avec une meilleure compréhension ce sont des statistiques pour contraindre les fonctionnements des personnes … le pire étant qu’on peut le faire avec les meilleures intentions ...

Une remarque ?

Qu’est-il important de savoir en statistiques et pour quoi faire ?