Fluctuation de l'échantillonnage et loi des grands nombres - Maxicours

Fluctuation de l'échantillonnage et loi des grands nombres

Objectifs
  • Simuler une expérience aléatoire sur tableur.
  • Connaitre la notion de fluctuation de l’échantillonnage.
  • Observer expérimentalement la loi des grands nombres à l’aide d’une simulation sur tableur.
Points clés
  • On répète n fois de manière indépendante une expérience aléatoire à deux issues. On appelle l’une de ces issues « succès », l’autre « échec ». La série statistique dont les valeurs sont les résultats obtenus lors de cette répétition d’expériences s’appelle un échantillon aléatoire de taille n.
  • Simuler une expérience aléatoire, c’est remplacer cette expérience par une autre plus simple à organiser et qui permet d’obtenir des résultats semblables. L’outil informatique peut aider dans cette démarche (programme en langage Python ou logiciel de type tableur).
  • Des échantillons de la même expérience aléatoire peuvent donner des résultats très différents. C’est ce que l’on appelle la fluctuation de l’échantillonnage.
  • À l’aide d’une simulation sur tableur, on peut observer la loi des grands nombres : lorsque la taille n de l’échantillon est grande, sauf exception, la fréquence observée d’un succès a tendance à se stabiliser autour d’un nombre qui est proche de la probabilité de ce succès.
  • Dans un échantillon aléatoire de taille n, on a au moins 95 % de chance de trouver la fréquence f d'un caractère dans un intervalle , où p est la proportion du caractère dans la population.
    Cet intervalle s’appelle l’intervalle de fluctuation au seuil de 95 %.
Pour bien comprendre
  • Calcul de probabilité simple
  • Utilisation du tableur
1. Échantillon aléatoire de taille n d’une expérience à deux issues
On répète n fois de manière indépendante une expérience aléatoire à deux issues. On appelle l’une de ces issues « succès », l’autre « échec ».
La série statistique dont les valeurs sont les résultats obtenus lors de cette répétition d’expériences s’appelle un échantillon aléatoire de taille n.
Remarque
Répéter n fois une expérience « de manière indépendante » signifie que le résultat d’une répétition n’influence pas le résultat des répétitions suivantes.
Exemple
Un sac contient 10 boules blanches et 20 boules noires.
Une expérience aléatoire consiste à prendre au hasard une boule dans le sac, à noter « succès » si c’est une boule noire, « échec » sinon, puis à remettre la boule dans le sac.
On répète 8 fois cette expérience. La répétition se fait bien de manière indépendante, car la boule tirée est toujours remise dans le sac, donc le résultat d’un tirage n’influence pas les tirages suivants.
On obtient un échantillon de taille 8 : {succès, échec, échec, succès, succès, échec, succès, succès}.
Contre-exemple
Reprenons le sac de boules de l’exemple précédent. Si maintenant, à chaque fois que l’on a tiré une boule, on l’enlève du sac, la répétition de cette expérience ne se fera plus de manière indépendante. En effet, si on a enlevé une boule blanche au premier tirage, alors au deuxième tirage on n’aura plus que 9 boules blanches dans le sac (au lieu des 10 qu’il y avait au départ). Le résultat de la deuxième expérience dépend donc de celui de la première expérience. Dans ce cas, on ne peut pas parler d’échantillon.
2. Fluctuation de l’échantillonnage et propriété de la loi des grands nombres
a. Obtention d’un échantillon aléatoire de taille n à l’aide d’une simulation sur tableur

Organiser une expérience aléatoire ou une répétition d’expériences aléatoires n’est pas toujours facile.

Exemples
  • Jouer à la roulette nécessite de se déplacer dans un casino ou d’acheter un matériel coûteux.
  • Lancer 100 fois une pièce équilibrée et noter la face obtenue après chaque lancer prend un certain temps.
Simuler une expérience aléatoire, c’est remplacer cette expérience par une autre plus simple à organiser et qui permet d’obtenir des résultats semblables. L’outil informatique peut aider dans cette démarche (programme en langage Python ou logiciel de type tableur).
Exemple
On considère l’expérience aléatoire qui consiste à lancer une pièce équilibrée et à noter la face obtenue (0 pour « face » et 1 pour « pile »). Comme la pièce est équilibrée, p(« obtenir face ») = p(« obtenir pile ») = 0,5. On veut répéter 30 fois de manière indépendante cette expérience.
Avec un tableur, on simule 30 fois le lancer de la pièce. Dans B2, on saisit la formule =ENT(ALEA()+0,5) et on recopie cette formule jusqu’en B31. La formule =ENT(ALEA()+0,5) permet d’obtenir 1 avec une probabilité égale à 0,5 et d’obtenir 0 avec une probabilité égale à 0,5. On obtient ainsi un échantillon de taille 30 de l’expérience :
Rappels
  • La fonction ALEA() permet de générer un nombre compris entre 0 et 1 (1 non compris). La formule ALEA()+0,5 permet donc de générer un nombre compris entre 0,5 et 1,5 (1,5 non compris).
  • La fonction ENT() arrondit à l’entier immédiatement inférieur.
Exemple (suite)

Pour obtenir la fréquence d’apparition de la valeur 1, autrement dit la fréquence d’apparition de « pile », on peut entrer comme ci-dessus la formule =SOMME(B2:B31)/30 dans la cellule B33.
  • =SOMME(B2:B31) effectue la somme de toutes les valeurs comprises dans la plage s’étendant de B2 à B31, et donc indique le nombre de fois où la valeur 1 est sortie dans cette plage.
  • La division par 30 donne la fréquence d’apparition de la valeur 1.

Dans cette simulation, « pile » a été obtenu 12 fois sur les 30 tirages. Sa fréquence est donc égale à 0,4.

b. Obtention de plusieurs échantillons et fluctuation de l’échantillonnage
Exemple (suite)
On simule à nouveau 30 fois sur tableur le lancer de la pièce équilibrée pour obtenir un deuxième échantillon de 30 résultats.

Le tableau ci-dessous présente la distribution des fréquences des deux échantillons de taille 30.

Échantillon 1
Résultat Pile Face
Nombre d'apparitions 17 13
Fréquence 0,57 0,43

Échantillon 2
Résultat Pile Face
Nombre d'apparitions 21 9
Fréquence 0,7 0,3

Sous forme graphique :


On constate des différences de résultats entre ces deux simulations : on dit qu’il y a fluctuation de l'échantillonnage.
Des échantillons de la même expérience aléatoire peuvent donner des résultats très différents. C’est ce que l’on appelle la fluctuation de l’échantillonnage.
c. Propriété de la loi des grands nombres
Exemple (suite)
Par contre, si l’on refait la même simulation avec des échantillons de taille 1000, on obtient le résultat suivant :

On observe que l’ampleur des fluctuations des fréquences diminue et que la fréquence d’apparition de chacune des faces de la pièce se rapproche de 0,5. Or, cette valeur correspond à la probabilité d’apparition de chacune des faces de la pièce.
On a p(« obtenir pile ») = p(« obtenir face ») = 0,5.
On observe ainsi la propriété dite « loi des grands nombres ».
Propriété (loi des grands nombres)
Lorsque la taille n de l’échantillon est grande, sauf exception, la fréquence observée d’un succès a tendance à se stabiliser autour d’un nombre qui est proche de la probabilité de ce succès.
3. Intervalle de fluctuation au seuil de 95 %

On prélève un échantillon dans une population. On cherche à connaitre la proportion f d’un caractère dans cet échantillon, sachant que l’on connait la proportion p de ce même caractère dans la population.

Dans ce cas, la proportion f du caractère étudié dans l’échantillon n’est pas nécessairement celle de la population. Néanmoins, cette proportion f a un comportement donné par la propriété suivante :

Propriété
Dans un échantillon aléatoire de taille n, on a au moins 95 % de chance de trouver la fréquence f d'un caractère dans un intervalle , où p est la proportion du caractère dans la population.
Cet intervalle s’appelle l’intervalle de fluctuation au seuil de 95 %.
Remarque
Ceci n'est vrai que pour des échantillons de taille n supérieure à 25 et pour une proportion p comprise entre 0,2 et 0,8.
Exemple
Un joueur tire une carte d’un jeu de cartes, puis la remet dans le paquet. Il gagne s'il tire un cœur. Il renouvelle cette expérience n fois.
La proportion des cœurs est : .
  • Si = 100, dans au moins 95 % des cas, la fréquence d’apparition d’un cœur fluctue dans l’intervalle [0,15 ; 0,35],
  • Si n = 10 000, dans au moins 95 % des cas, la fréquence d’apparition d’un cœur fluctue dans l’intervalle [0,24 ; 0,26].

Vous avez déjà mis une note à ce cours.

Découvrez les autres cours offerts par Maxicours !

Découvrez Maxicours

Comment as-tu trouvé ce cours ?

Évalue ce cours !

 

quote blanc icon

Découvrez Maxicours

Exerce toi en t’abonnant

Des profs en ligne

  • 6j/7 de 17 h à 20 h
  • Par chat, audio, vidéo
  • Sur les matières principales

Des ressources riches

  • Fiches, vidéos de cours
  • Exercices & corrigés
  • Modules de révisions Bac et Brevet

Des outils ludiques

  • Coach virtuel
  • Quiz interactifs
  • Planning de révision

Des tableaux de bord

  • Suivi de la progression
  • Score d’assiduité
  • Un compte Parent