Estimer une probabilité ou une proportion dans une population
- Fiche de cours
- Quiz
- Profs en ligne
- Videos
- Application mobile
- Définir un échantillon aléatoire de taille n pour une expérience à deux issues.
- Estimer une probabilité par une fréquence observée sur un échantillon.
- Estimer une proportion par une fréquence observée sur un échantillon.
- Lorsque l’effectif d’une population est important, étudier un ou plusieurs caractères de cette population de manière exhaustive peut être difficile, voire impossible. En revanche, il est possible de prélever dans cette population, de façon successive et indépendante, plusieurs individus qui formeront une partie plus petite de la population. On nomme cette plus petite partie un échantillon aléatoire de taille n.
- Étudier un ou plusieurs caractères d’un échantillon permettra d’obtenir des informations sur la population, avec plus ou moins de précision selon la taille de l’échantillon.
- Pour estimer la probabilité d’un succès, on peut utiliser la loi des grands nombres : lorsque la taille n de l’échantillon est grande, sauf exception, la fréquence observée d’un succès a tendance à se stabiliser autour d’un nombre qui est proche de la probabilité de ce succès.
- La propriété suivante permet
d’estimer la proportion p d’un caractère
dans une population. Sur des échantillons de grande
taille n, la
valeur de la proportion p peut être
approchée par la valeur de la fréquence
f
observée sur l’échantillon.
L’erreur commise est, dans une grande majorité des cas, inférieure ou égale à .
Simulation d'une expérience aléatoire
En revanche, il est possible de prélever dans cette population, de façon successive et indépendante, plusieurs individus qui formeront une partie plus petite de la population. On nomme cette plus petite partie un échantillon aléatoire de taille n.
On ne peut pas demander à tous les habitants d’une grande ville s’ils souhaitent l’installation d’une nouvelle ligne de tram (il y a trop d’habitants à interroger). En revanche, on peut questionner une partie seulement des habitants de la ville sur ce sujet. C'est le principe du sondage d’opinion.
Étudier un ou plusieurs caractères d’un échantillon aléatoire permettra d’obtenir des informations sur la population, avec plus ou moins de précision selon la taille de l'échantillon.
On considère une expérience
aléatoire à deux issues. On appelle
l’une de ces deux issues succès,
l’autre échec.
Pour estimer la probabilité d’un
succès, on peut utiliser la loi des grands
nombres.
Lorsque la taille n de l’échantillon est grande, sauf exception, la fréquence observée d’un succès a tendance à se stabiliser autour d’un nombre qui est proche de la probabilité de ce succès.
À l’aide d’un tableur, on simule le lancer d’une pièce de monnaie équilibrée. On appelle succès le fait d’obtenir « pile ».
On suppose que l’on ne connait pas la probabilité d’obtenir « pile ». Pour estimer cette probabilité, on peut étudier l’évolution des fréquences de « pile » sur des échantillons dont la taille est de plus en plus grande. La taille d'un échantillon représente le nombre de lancers de la pièce simulés à l'aide du tableur.
On obtient le graphique suivant :
Ici, on observe que plus la taille des échantillons augmente, plus la fréquence de « pile » se rapproche de . À partir d’un échantillon de grande taille (supérieure ou égale à 500), on peut donc estimer à la probabilité d’obtenir « pile » sur une pièce de monnaie équilibrée.
Souvent, on ne connait pas la proportion p d’un caractère
dans une population mais on connait la fréquence
f de ce
même caractère dans un échantillon
aléatoire.
On peut alors donner une estimation de la
proportion p de ce caractère dans
la population grâce à la
propriété suivante.
Sur des échantillons de grande taille n, la valeur de la proportion p peut être approchée par la valeur de la fréquence f observée sur l’échantillon.
L’erreur commise est, dans une grande majorité des cas, inférieure ou égale à .
- Cette erreur est d’autant plus petite que n est grand.
- On peut reformuler la propriété ci-dessus en disant que dans une grande majorité des cas, la proportion p doit se trouver dans l’intervalle . Cet intervalle est appelé l’intervalle de confiance.
En France, une semaine avant le deuxième tour des élections présidentielles, un institut de sondage interroge 900 personnes sur leur intention de vote. 412 d’entre elles déclarent leur intention de voter pour le candidat A. Indiquer une valeur approchée de la proportion de votants favorables au candidat A en France.
Dans l’échantillon aléatoire de 900 personnes, la fréquence observée de votants favorables au candidat A est . On peut donc estimer que la proportion de votants favorables au candidat A dans l’ensemble de la population française est proche de 45,8 %.
Le risque de commettre une erreur est très probablement d’au plus .
Dans un lycée, on prélève un échantillon aléatoire de 200 élèves. On constate que dans cet échantillon, 123 élèves ont les cheveux noirs. Indiquer une valeur approchée de la proportion d’élèves aux cheveux noirs dans l’établissement.
Dans l’échantillon aléatoire de 200 élèves, la fréquence observée d’élèves aux cheveux noirs est de = 0,615, soit 61,5 %. On peut donc prendre comme valeur approchée de la proportion d’élèves qui ont les cheveux noirs dans le lycée.
Le risque de commettre une erreur est très probablement d’au plus .
Vous avez obtenu75%de bonnes réponses !