Analyse de données
- Fiche de cours
- Quiz
- Profs en ligne
- Videos
- Application mobile
Objectif
Utiliser de façon appropriée le couple moyenne,
écart-type ou médiane, écart
interquartile.
Comprendre les subtilités dues à l’effet de structure.
Construire et utiliser un diagramme en boite.
Comprendre les subtilités dues à l’effet de structure.
Construire et utiliser un diagramme en boite.
Pour les définitions qui suivent un exemple sera
proposé à partir des données obtenues en
relevant chaque jour les températures d’un mois de
janvier ou de février (d’une année non
bissextile) d’une ville située à
proximité de la mer :
Janvier : 3 ; 2 ; 3 ; 5 ; 5 ; 8 ; −1 ; −3 ; −4 ; −7 ; 3 ; 9 ; 11 ; 8 ; 5 ; 1 ; 5 ; 3 ; 5 ; 8 ; 12 ; 13 ; 11 ; 8 ; 5 ; 3 ; 5 ; 8 ; 5 ; 11.
Les données de janvier sont regroupées et triées par ordre croissant dans un tableau, avec les effectifs cumulés :
Février : 10 ; 12 ; 9 ; 5 ; −1 ; −2 ; −4 ; −5 ; −2 ; 3 ; 7 ; 9 ; 7 ; 7 ; 5 ; 10 ; 13 ; 12 ; 7 ; 5 ; −1 ; 0 ; 3 ; 5 ; 5 ; 7 ; 10 ; 13.
Les données de février sont regroupées et triées par ordre croissant dans un tableau, avec les effectifs cumulés :
Janvier : 3 ; 2 ; 3 ; 5 ; 5 ; 8 ; −1 ; −3 ; −4 ; −7 ; 3 ; 9 ; 11 ; 8 ; 5 ; 1 ; 5 ; 3 ; 5 ; 8 ; 12 ; 13 ; 11 ; 8 ; 5 ; 3 ; 5 ; 8 ; 5 ; 11.
Les données de janvier sont regroupées et triées par ordre croissant dans un tableau, avec les effectifs cumulés :
Rang, Indice i | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 |
Température : xi | −7 | −4 | −3 | −1 | 1 | 2 | 3 | 5 | 8 | 9 | 11 | 12 | 13 |
Nb jours ni | 1 | 1 | 1 | 2 | 1 | 1 | 5 | 8 | 5 | 1 | 3 | 1 | 1 |
Effectifs cumulés | 1 | 2 | 3 | 5 | 6 | 7 | 12 | 20 | 25 | 26 | 29 | 30 | 31 |
Février : 10 ; 12 ; 9 ; 5 ; −1 ; −2 ; −4 ; −5 ; −2 ; 3 ; 7 ; 9 ; 7 ; 7 ; 5 ; 10 ; 13 ; 12 ; 7 ; 5 ; −1 ; 0 ; 3 ; 5 ; 5 ; 7 ; 10 ; 13.
Les données de février sont regroupées et triées par ordre croissant dans un tableau, avec les effectifs cumulés :
Rang, Indice i | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 |
Température : xi | −5 | −4 | −2 | −1 | 0 | 3 | 5 | 7 | 9 | 10 | 12 | 13 |
Nb jours ni | 1 | 1 | 2 | 2 | 1 | 2 | 5 | 5 | 2 | 3 | 2 | 2 |
Effectifs cumulés | 1 | 2 | 4 | 6 | 7 | 9 | 14 | 19 | 21 | 24 | 26 | 28 |
1. Résumé chiffré
Un résumé chiffré d’une
série statistique est l’énoncé
d’une valeur centrale, d’un
paramètre de position comme la moyenne ou
la médiane, associé à son
paramètre de dispersion :
écart-type pour la moyenne, écart
interquartile pour la médiane.
Exemples :
• Pour le mois de janvier, un résumé chiffré serait : moyenne 4,8 et écart-type 4,7. On peut choisir médiane 5, écart interquartile 5.
• Pour le mois de février, un résumé chiffré serait : moyenne 5,3 et écart-type 5,1. On peut choisir médiane 6, écart interquartile 8.
2. Effet de structure
À partir d’une remarque et de la
définition de l’effet de structure de
L’INSEE (Institut national de la statistique et des
études économiques) :
Cela semble paradoxal que dans une population répartie en sous-populations, il puisse arriver qu'une grandeur évolue dans un sens sur chaque sous-population et dans le sens contraire sur l'ensemble de la population.
Ce paradoxe s'explique parce que les effectifs de certaines sous-populations augmentent alors que d'autres régressent : c'est l'effet de structure.
Par exemple, le salaire de chaque profession peut stagner (ou augmenter faiblement) alors que le salaire moyen augmente fortement ; cela arrive si les professions très qualifiées, les mieux payées, sont de plus en plus nombreuses et, réciproquement, les emplois non qualifiés, les moins payés, de plus en plus rares.
A contrario, la variation à structure constante se calcule comme une moyenne pondérée des variations des moyennes de chaque sous-population, les pondérations étant les masses de la grandeur pour chaque sous-population.
Exemple :
Dans une même entreprise, on peut remarquer une augmentation de salaire pour toutes les catégories.
Pourtant, le salaire moyen en 2010 vaut alors que celui de 2011 vaut donc moins.
La structure de l’entreprise a changé, le personnel au salaire le moins élevé est en proportion beaucoup plus nombreux.
Cela semble paradoxal que dans une population répartie en sous-populations, il puisse arriver qu'une grandeur évolue dans un sens sur chaque sous-population et dans le sens contraire sur l'ensemble de la population.
Ce paradoxe s'explique parce que les effectifs de certaines sous-populations augmentent alors que d'autres régressent : c'est l'effet de structure.
Par exemple, le salaire de chaque profession peut stagner (ou augmenter faiblement) alors que le salaire moyen augmente fortement ; cela arrive si les professions très qualifiées, les mieux payées, sont de plus en plus nombreuses et, réciproquement, les emplois non qualifiés, les moins payés, de plus en plus rares.
A contrario, la variation à structure constante se calcule comme une moyenne pondérée des variations des moyennes de chaque sous-population, les pondérations étant les masses de la grandeur pour chaque sous-population.
Exemple :
Dans une même entreprise, on peut remarquer une augmentation de salaire pour toutes les catégories.
2010 | 2011 | |||
Effectif | Salaire mensuel moyen brut | Effectif | Salaire mensuel moyen brut | |
Employés | 708 | 1 640 € | 808 | 1 800 € |
Cadres | 286 | 4 500 € | 187 | 4 600 € |
Direction | 6 | 8 000 € | 5 | 9 000 € |
Pourtant, le salaire moyen en 2010 vaut alors que celui de 2011 vaut donc moins.
La structure de l’entreprise a changé, le personnel au salaire le moins élevé est en proportion beaucoup plus nombreux.
3. Diagramme en boite (ou diagramme de Tukey ou boite
à moustaches ou boite à pattes)
La présentation d’un résumé
chiffré avec le couple médiane-écart
interquartile se fait souvent sous la forme d’un
diagramme en boite qui présente la
médiane et la répartition des
données autour de cette médiane selon la
convention suivante (initiée par John Tukey
mathématicien américain) :
Le type diagramme en boite permet une comparaison rapide de plusieurs séries de données.
Le type diagramme en boite permet une comparaison rapide de plusieurs séries de données.
Vous avez obtenu75%de bonnes réponses !