Prise de décision, estimation
- Fiche de cours
- Quiz
- Profs en ligne
- Videos
- Application mobile
Objectif(s)
• Estimer une proportion inconnue à partir
d’un échantillon.
• Déterminer une taille d’échantillon suffisante pour obtenir, avec une précision donnée, une estimation d’une proportion au niveau de confiance 0,95.
• Déterminer une taille d’échantillon suffisante pour obtenir, avec une précision donnée, une estimation d’une proportion au niveau de confiance 0,95.
1. Prise de décision, rejeter ou non une
hypothèse
On suppose que la proportion d’un caractère
d’une population est p. C’est une
hypothèse.
Après réalisation d’un sondage de ce caractère sur un échantillon de taille n de cette population, on constate une fréquence f de ce caractère.
Exemple
Dans une classe de 35 élèves, on dénombre 6 gauchers, soit une proportion de 17,14 %.
La proportion de gauchers dans la population totale est estimée à 15,88 % (d’après documents de recherche scientifique).
On fait l’hypothèse que la classe est représentative de la réalité en proportion de gauchers.
Peut-on valider cette hypothèse ?
• Vérifions les conditions :
n doit être plus grand que 30 : n = 35, condition validée.
n × p doit être plus grand que 5 : n × p = 35 × 0,1714 = 5,99, condition validée.
et n × (1-p) doit être plus grand que 5 : n × (1-p) = 35 × 0,8286 = 29, condition validée.
Intervalle dans lequel devrait se trouver la proportion de gauchers de la population totale si l’hypothèse était vérifiée :
.
,
soit : .
La valeur réelle est dans l’échantillon, au risque d’erreur de 5 % (ou au seuil de confiance de 95 %), on accepte l’hypothèse.
Remarque
L’intervalle a une grande amplitude car la taille de l’échantillon est petite.
Après réalisation d’un sondage de ce caractère sur un échantillon de taille n de cette population, on constate une fréquence f de ce caractère.
Pour accepter ou rejeter l’hypothèse
choisie, au seuil de confiance de 95 %,
c'est-à-dire au risque de 5 % de se tromper, on
calcule l’intervalle I de fluctuation asymptotique
de la fréquence au seuil de 95 %.
• Si f I, on accepte l’hypothèse d’une proportion p du caractère dans la population est correcte au seuil de risque de 5 % (ou avec 95 % de confiance dans le résultat).
• Sinon, on rejette cette hypothèse au seuil de 5 %.
• Si f I, on accepte l’hypothèse d’une proportion p du caractère dans la population est correcte au seuil de risque de 5 % (ou avec 95 % de confiance dans le résultat).
• Sinon, on rejette cette hypothèse au seuil de 5 %.
Exemple
Dans une classe de 35 élèves, on dénombre 6 gauchers, soit une proportion de 17,14 %.
La proportion de gauchers dans la population totale est estimée à 15,88 % (d’après documents de recherche scientifique).
On fait l’hypothèse que la classe est représentative de la réalité en proportion de gauchers.
Peut-on valider cette hypothèse ?
• Vérifions les conditions :
n doit être plus grand que 30 : n = 35, condition validée.
n × p doit être plus grand que 5 : n × p = 35 × 0,1714 = 5,99, condition validée.
et n × (1-p) doit être plus grand que 5 : n × (1-p) = 35 × 0,8286 = 29, condition validée.
Intervalle dans lequel devrait se trouver la proportion de gauchers de la population totale si l’hypothèse était vérifiée :
.
,
soit : .
La valeur réelle est dans l’échantillon, au risque d’erreur de 5 % (ou au seuil de confiance de 95 %), on accepte l’hypothèse.
Remarque
L’intervalle a une grande amplitude car la taille de l’échantillon est petite.
2. Estimation d'une proportion
Dans la partie 2, la proportion du caractère
étudié est supposée connue.
Dans ce paragraphe, il s’agit, à partir d’un échantillon de déterminer la proportion du caractère pour toute la population (ce que l’on retrouve dans les sondages par exemple).
On choisit un échantillon de taille n. Soit f la fréquence dans l’échantillon, du caractère recherché dans la population totale dont la proportion « vraie » est p.
On utilisera généralement l’une des deux formules suivantes (cela devrait être précisé par l’énoncé, la seconde étant rarement utilisée).
Dans ce paragraphe, il s’agit, à partir d’un échantillon de déterminer la proportion du caractère pour toute la population (ce que l’on retrouve dans les sondages par exemple).
On choisit un échantillon de taille n. Soit f la fréquence dans l’échantillon, du caractère recherché dans la population totale dont la proportion « vraie » est p.
On utilisera généralement l’une des deux formules suivantes (cela devrait être précisé par l’énoncé, la seconde étant rarement utilisée).
a. Premier intervalle d'estimation d'une proportion
de la population
Avec un niveau de confiance de 95 % , p devrait
être dans l’intervalle .
Exemple
Un club automobile réunit plus de 250 000 adhérents ayants tous un véhicule. Par sondage sur la fiche de 1 000 membres, ils trouvent qu’ils sont 631 à posséder un véhicule diesel.
Quel pourrait être l’intervalle dans lequel se trouve la proportion de diesels dans l’ensemble des véhicules français ?
Les conditions sont vérifiées.
Nous avons : .
On peut supposer que 59,94 à 66,26 % des véhicules seraient des diesels.
Remarque
Une revue automobile publie l’information : « Le parc automobile français compte en 2012 un peu plus de 30 millions de voitures particulières neuves, se compose à environ 50 % de véhicules équipés d'une motorisation diesel ».
Le parc automobile français comporte de nombreux véhicules anciens. Les véhicules diesels sont surtout des véhicules récents (3 véhicules neufs sur 4 en 2012). Si le parc des adhérents est plutôt récent, il est assez normal d’y trouver plus de diesels que dans le parc automobile français.
b. Deuxième intervalle d'estimation d'une
proportion de la population
Avec un niveau de confiance de 95 %, p devrait
être dans l’intervalle :
.
.
Exemple
Avec les mêmes conditions que pour l’exemple précédent on obtient :
.
On pourrait supposer que 60,11 à 66,09 % des véhicules seraient des diesels (voir remarque précédente). Cet intervalle est plus restrictif que le précédent.
3. Détermination de la taille minimale d'un
échantillon
On utilisera le premier type d’intervalle de
confiance à 95 % (partie 4. a). L’écart
est donné par .
Exemple
La population française en âge de voter était de 42 millions aux élections présidentielles de 2012. Quelle doit être la taille d’un échantillon d’électeurs pour que dans un intervalle de confiance de 95 %, l’erreur d’estimation soit inférieure à 3 % ?
Il faut , soit que l’on peut écrire (passer par le carré) .
Il faut donc interroger 1112 personnes.
Exemple
La population française en âge de voter était de 42 millions aux élections présidentielles de 2012. Quelle doit être la taille d’un échantillon d’électeurs pour que dans un intervalle de confiance de 95 %, l’erreur d’estimation soit inférieure à 3 % ?
Il faut , soit que l’on peut écrire (passer par le carré) .
Il faut donc interroger 1112 personnes.
Vous avez obtenu75%de bonnes réponses !