La réussite scolaire pour tous !

Cours de mathématiques 1re S - Statistique descriptive, analyse de données


Note par nos Maxinautes :  
Objectif
Découvrir de nouveaux paramètres caractérisant une série, réaliser un diagramme schématique synthétisant certains paramètres.
1. Diagramme en boite
Une bonne connaissance des définitions vues les années précédentes est un pré-requis fondamental, des rappels sommaires sont toutefois proposés.
a. Rappels
On considère pour toute la suite une série statistique à N individus, dont un caractère quantitatif prend les valeurs  (N entier non nul).

La médiane : la médiane de la série est un réel Me tel que :
                  ♦ 50% au moins des valeurs du caractère sont inférieures ou égales à Me
                  ♦ 50% au moins des valeurs du caractère sont supérieurs à Me.

Les quartiles : complétant la médiane, ce sont deux autres nombres Q1 et Q3 tels que :
                  ♦ Q1, premier quartile, est la plus petite valeur prise par le caractère telle que 25% au moins des valeurs lui soient inférieures ou égales.
                  ♦ Q3, troisième quartile, est la plus petite valeur prise par le caractère telle que 75% au moins des valeurs lui soient inférieures ou égales.

Une règle de calcul pour la médiane :
                 ♦ si n est impair, Me est la valeur centrale, celle de rang
                 ♦ si n est pair, Me est la moyenne des deux valeurs les plus au centre, de rangs .

Remarque
: on  peut également définir les déciles, dont principalement D1 et D9, en reprenant les définition des Q1 et Q3 en remplaçant respectivement 25% et 75% par 10% et 90%.

L'écart interquartile : C'est la différence .

Remarque : l'intervalle est appelé intervalle interquartile mais attention, suivant les sources, l'intervalle interquartile n'est autre que l'écart .
b. Le diagramme en boite
Le diagramme en boite, appelé également boite à moustaches, est en quelque sorte une représentation symbolique comportant divers paramètres de la série. Sa définition peut varier suivant les auteurs mais de manière consensuelle, on y trouvera toujours :
- la médiane Me
- les quartiles Q1 et Q3
- les minimales et maximales du caractère (Min et Max).


Le cas échéant, on y trouvera également les déciles D1 et D9 ( et même des centiles...).

Sa conception obéit aux règles qu'illustre cet exemple :



En réalité, sur l'axe gradué qui est sous la boite ne doivent figurer que les valeurs des graduations.
c. Exemple
On considère la série statistique de 50 valeurs présentées dans le tableau ci-dessous. On a pris soin de les ordonner de la plus petite à la plus grande.

5

15

19

21

29

7

16

19

21

30

11

16

19

23

33

14

16

19

24

33

15

16

19

24

33

15

16

20

25

33

15

16

20

25

33

15

17

20

26

34

15

18

20

27

34

15

18

21

28

35


La plus petite valeur est Min = 5, la plus grande Max = 35.
Il y a 50 valeurs, la médiane est la moyenne de de la 25ème et de la 26ème : Me = (19+20)/2 = 19,5
Pour Q1 : 25% de 50, cela fait 12,5, il faut laisser au moins 25% en dessous de Q1, on prend la 13ième valeur : Q1 = 16.
Pour Q3 : 75% de 50, cela fait 37,5 , il faut laisser 75% au moins en dessous de Q3, on prend la 38ème valeur: Q3 = 26.

L'écart interquartile est donc égal à Q3-Q1 = 26-16 = 10.
Voici une représentation de la boite à moustache de cette série.



2. Variance et écart type
a. Rappel : la moyenne
Soit une série statistique prenant les valeurs avec les effectifs respectifs .
La moyenne de cette série est le réel : .

Cette moyenne peut également se calculer à l'aide des fréquences, en posant :
, on obtient la nouvelle formule équivalente :

b. Variance et écart type
La variance de la série exposée précédemment est le réel :
C'est un réel positif, qui n'est autre que " la moyenne des écarts au carré à la moyenne ".

En utilisant le symbole (symbole "grand sygma"), voici ce que l'on obtient (N désignant l'effectif total) :
.
La variance est positive, elle ne s'annule que si la série n'est composée que de 0 !

L'écart type n'est autre que la racine carrée de la variance, on le note communément . C'est la lettre grecque "sigma minuscule ou petit sigma", on lit simplement "sigma": .

On remarquera qu'étant une racine carrée, est un réel positif.
c. Exemple
Soit la série de 80 nombres suivante:

xi

2

3

4

5

10

11

12

14

15

17

ni

1

4

5

7

12

15

14

7

7

8


La moyenne est :
Soit .

Calcul de la variance :
.

D'où un écart type égal à : .

Ces calculs sont facilement réalisables à l'aide des "menus stat" des calculatrices.
L'essentiel
On retiendra que le diagramme en boite est composé généralement des valeurs extrêmes, des quartiles et de la médiane.
L'écart type est la racine carrée de la variance, la variance mesure la moyenne des écarts au carré à la moyenne, selon la formule: .
Statistique descriptive, analyse de données 4/5 basé sur 76 votes.
Vous êtes ici :
Accueil > Fiches de cours du CP à la Terminale > cours de Mathématiques > 1re S > Statistique descriptive, analyse de données
Accueil > Fiches de cours du CP à la Terminale > cours de Mathématiques > 1re S > Statistique descriptive, analyse de données
Voir tout le contenu pédagogique relatif à ce sujet
Connexion ou Créer un compte