La réussite scolaire pour tous !

Cours de mathématiques 1re ES - Vocabulaire de la statistique


Note par nos Maxinautes :  
Objectif
Étudier une série statistique à partir des outils de base (moyenne, médiane, etc.).
1. Rappels
• Une étude statistique recherche les caractéristiques d’une, ou plusieurs, variables statistiques afin d’obtenir une image d’un certain phénomène.

• Une présentation statistique est un résumé d’une étude statistique. Ce résumé peut se présenter sous forme de représentations graphiques, de tableaux, de séries de nombres mis en valeurs.

• La moyenne, la médiane, le mode, les quartiles (et les déciles) sont des caractéristiques de position. L’élément « central » (moyenne, médiane) est montré comme le représentant de la série.

• L’étendue, l’écart interquartile (Q3-Q1), sont des caractéristiques de dispersion. On recherche quel écart, quelle dispersion on peut s’attendre vis-à-vis de l’élément central choisi pour représenter la série. L’écart interquartile « mesure » la dispersion de la médiane. En première on ajoute la variance et l’écart-type comme mesure de la dispersion de la moyenne.
2. Définitions et notations
Les définitions sont à connaître, les notations doivent s’apprendre petit à petit pour écrire plus rapidement les formules. Dans les exercices et problèmes il faut écrire les formules puis donner les résultats calculés par une calculatrice.

Pour les définitions qui suivent un exemple sera proposé à partir des données obtenues en relevant chaque jour les températures d’un mois de janvier ou de février (d’une année non bissextile) d’une ville située à proximité de la mer :

Janvier : 3 ; 2 ; 3 ; 5 ; 5 ; 8 ; −1 ; −3 ; −4 ; −7 ; 3 ; 9 ; 11 ; 8 ; 5 ; 1 ; 5 ; 3 ; 5 ; 8 ; 12 ; 13 ; 11 ; 8 ; 5 ; 3 ; 5 ; 8 ; 5 ; 11.
Les données de janvier sont regroupées et triées par ordre croissant dans un tableau, avec les effectifs cumulés :

Rang, Indice i 1 2 3 4 5 6 7 8 9 10 11 12 13
Température : xi −7 −4 −3 −1 1 2 3 5 8 9 11 12 13
Nb jours ni 1 1 1 2 1 1 5 8 5 1 3 1 1
Effectifs cumulés 1 2 3 5 6 7 12 20 25 26 29 30 31

Février : 10 ; 12 ; 9 ; 5 ; −1 ; −2 ; −4 ; −5 ; −2 ; 3 ; 7 ; 9 ; 7 ; 7 ; 5 ; 10 ; 13 ; 12 ; 7 ; 5 ; −1 ; 0 ; 3 ; 5 ; 5 ; 7 ; 10 ; 13.
Les données de février sont regroupées et triées par ordre croissant dans un tableau, avec les effectifs cumulés :

Rang, Indice i 1 2 3 4 5 6 7 8 9 10 11 12
Température : xi −5 −4 −2 −1 0 3 5 7 9 10 12 13
Nb jours ni 1 1 2 2 1 2 5 5 2 3 2 2
Effectifs cumulés 1 2 4 6 7 9 14 19 21 24 26 28

a. Etendue
Différence entre la plus grande et la plus petite valeur de la série.

Exemples :
• pour le mois de janvier, l’étendue est de .
• pour le mois de février, l’étendue est de .
b. Mode ou dominante
La valeur de la série la plus représentée (il peut y en avoir plusieurs !).

Exemples :
• pour le mois de janvier, mode 5 car cette valeur a le plus grand effectif 8.
• pour le mois de février, mode 5 et 7 car ces valeurs ont les plus grands effectifs 5.
c. Moyenne, ou moyenne arithmétique, ou moyenne pondérée
La moyenne pondérée est notée .

en posant

Exemples :

Pour le mois de janvier :
• calcul de l’effectif total (on remarquera que janvier a bien 31 jours !).
• calcul de la moyenne
On arrondi le résultat selon les conditions. Ici, une décimale suffit. Moyenne de la série des températures de janvier : .

Pour le mois de février, l’utilisation d’une calculatrice ou d’un tableur donne .

Remarque
: quand les données sont fournies sous forme d’intervalles on prendra (en général) le milieu de chaque intervalle.

Attention
: en général, la moyenne des moyennes n’est pas forcément la moyenne du tout ! c’est l’effet de structure.
Exemple : dans une entreprise 60 employés ont un salaire net mensuel de 1 200 €. 30 cadres ont un salaire net mensuel de 2 400 €. Calculer la moyenne des salaires de l’entreprise.
Il est clair que la moyenne de chaque sous série est de 1 200 € pour les employés et 2 400 € pour les cadres.
Or, n’est pas la moyenne des salaires versés par l’entreprise : correspond à la moyenne des salaires versés par l’entreprise.
d. Médiane (notée Me)
Les valeurs doivent être rangées par ordre croissant.

Médiane : plus petite valeur de la variable telle que « au moins 50 % » des valeurs de la liste lui soit inférieures ou égales, « au moins 50 % » des valeurs de la liste lui soit supérieures ou égales.

En pratique :
Si la taille de la série est impaire (N peut s’écrire sous la forme N = 2n + 1) la médiane est la valeur de la variable statistique de rang n + 1
Si la taille de la série est paire (N peut s’écrire sous la forme N = 2n) la médiane est la valeur de la moyenne des variables statistiques de rang n et n + 1.

Exemples :

• Pour le mois de janvier, 31 est impair donc n = 15. La médiane est la température du 15e jour du tableau (pas du mois !), c’est 5°C car cette valeur se trouve affectée aux jours 13 ; 14 ; 15 ; 16 ; 17 ; 18 ; 19 et 20. La médiane est donc 5°C.

• Pour le mois de février, 28 est pair donc n = 14. La médiane est la moyenne des températures du 14e et du 15e jours du tableau. Le 14e jour la température est de 5°C, le 15e elle est de 7°C, moyenne de ces deux températures 6°C. La médiane est donc 6°C.

Remarque : savoir lire le tableau, pour février, les 15e, 16e, 17e, 18e et 19e valeurs sont affectés de la même température 7°C.
e. Compréhension et différence moyenne-médiane
La moyenne exprime la grandeur unique qu'auraient chacune des valeurs de la série, si elles étaient toutes égales. Elle est fortement perturbée par des valeurs extrêmes très faibles ou très forte.

La médiane sépare la moitié de la population étudiée en deux parties. Elle n’est pas affectée par des valeurs extrêmes.

Pour exemple, en 2008 en France le salaire moyen était de 1 900 € net par mois alors que le salaire médian était de 1 528 € net par mois (source INSEE). Le salaire moyen laisse penser que « presque tous les salariés ont 1 900 € net par mois». Le salaire médian indique « la moitié au moins des salariés ont moins de 1 528 € par mois ». La moyenne est tirée vers le haut par les gros salaires, alors que, vers le bas le SMIC est une valeur minimale.
f. Quartiles (notés Q1 ; Q2 et Q3)
On ne représente généralement que Q1 et Q3, car Q2 correspond à la médiane ou presque. Les valeurs doivent être rangées par ordre croissant.

Premier quartile : plus petite valeur de la variable telle que « au moins 25 % » des valeurs de la liste lui soit inférieures ou égales (remarque : 25 % c’est 1/4).

Troisième quartile : plus petite valeur de la variable telle que « au moins 75 % » des valeurs de la liste lui soit inférieures ou égales (remarque : 75 % c’est 3/4).

Exemples :

• Recherche de Q1 pour le mois de janvier : 31 jours, donc 31 valeurs. . On prendra la valeur juste supérieure, soit 8. Q1 est donc la 8e valeur de la série (tableau). C’est la température 3°C placée dans la colonne d’indice 7 qui contient les observations 8 ; 9 ; 10 ; 11 et 12. Q1 = 3°C.
recherche de Q3 pour le mois de janvier : 31 jours, donc 31 valeurs. . On prendra la valeur juste supérieure, soit 24. Q3 est donc la 24e valeur de la série (tableau). C’est la température 8°C placée dans la colonne de rang 9 qui contient les observations 21 ; 22 ; 23 ; 24 et 25. Q3 = 8°C.

• Recherche de Q1 pour le mois de février : 28 jours, donc 28 valeurs, . On prendra la moyenne des valeurs de rang 7 et 8, soit . Q1 = 1,5°C.
recherche de Q3 pour le mois de janvier : 28 jours, donc 28 valeurs. . On prendra la moyenne des valeurs de rang 21 et 22, soit . Q3 = 9,5°C.
g. Ecart interquartile
C’est la différence entre les valeurs de Q3 et Q1.

Exemples :
• Pour le mois de janvier, Q3 – Q1 = 8 – 3 = 5.
• Pour le mois de février, Q3 – Q1 = 9,5 – 1,5 = 8.
h. Résumé visuel

3. Variance (notée V(x))
Elle est donnée sous deux formes (formules) équivalentes :

ou


Remarque
: on ne calcule pas la variance. Elle est donnée par une calculatrice, ou un tableur (qui en réalité calcule la variance et donne la variable suivante).
4. Ecart-type
L'écart-type est noté σx.

Exemples :
• Pour le mois de janvier, ma calculatrice donne σx = 4,7.
• Pour le mois de février, ma calculatrice donne σx = 5,1.

Remarque
: il faut connaître par cœur les définitions et formules des caractéristiques statistiques ET de savoir utiliser une calculatrice pour obtenir les résultats demandés.
Vocabulaire de la statistique 3/5 basé sur 32 votes.
Vous êtes ici :
Accueil > Fiches de cours du CP à la Terminale > cours de Mathématiques > 1re ES > Vocabulaire de la statistique
Voir tout le contenu pédagogique relatif à ce sujet
Connexion ou Créer un compte