Simuler N échantillons de taille n d'une expérience aléatoire à deux issues - Maxicours

Simuler N échantillons de taille n d'une expérience aléatoire à deux issues

Objectifs
  • Simuler sur tableur N échantillons de taille n d’une expérience aléatoire à deux issues.
  • Si p est la probabilité d’une issue et ƒ sa fréquence observée dans un échantillon, calculer la proportion des cas où l’écart entre p et ƒ est inférieur ou égal à .
Points clés
  • On répète n fois de manière indépendante une expérience aléatoire à deux issues. On appelle l’une de ces issues « succès », l’autre « échec ». La série statistique dont les valeurs sont les résultats obtenus lors de cette répétition d’expériences s’appelle un échantillon aléatoire de taille n.
  • Simuler une expérience aléatoire, c’est remplacer cette expérience par une autre plus simple à organiser et qui permet d’obtenir des résultats semblables. L’outil informatique peut aider dans cette démarche (programme en langage Python ou logiciel de type tableur).
Pour bien comprendre
  • Calcul de probabilité simple
  • Utilisation du tableur
  • Fluctuation de l’échantillonnage au seuil de 95 %
1. Échantillon aléatoire de taille n d’une expérience à deux issues
On répète n fois de manière indépendante une expérience aléatoire à deux issues. On appelle l’une de ces issues « succès », l’autre « échec ».
La série statistique dont les valeurs sont les résultats obtenus lors de cette répétition d’expériences s’appelle un échantillon de taille n.
Remarque
Répéter n fois une expérience « de manière indépendante » signifie que le résultat d’une répétition n’influence pas le résultat des répétitions suivantes.
Exemple
Un sac contient 10 boules blanches et 20 boules noires.
Une expérience aléatoire consiste à prendre au hasard une boule dans le sac, à noter « succès » si c’est une boule noire, « échec » sinon, puis à remettre la boule dans le sac.
On répète 8 fois cette expérience. La répétition se fait bien de manière indépendante, car la boule tirée est toujours remise dans le sac, donc le résultat d’un tirage n’influence pas les tirages suivants.
On obtient un échantillon de taille  8 : {succès, échec, échec, succès, succès, échec, succès, succès}.
Contre-exemple
Reprenons le sac de boules de l’exemple précédent. Si maintenant, à chaque fois que l’on a tiré une boule, on l’enlève du sac, la répétition de cette expérience ne se fera plus de manière indépendante. En effet, si on a enlevé une boule blanche au premier tirage, alors au deuxième tirage on n’aura plus que 9 boules blanches dans le sac (au lieu des 10 qu’il y avait au départ). Le résultat de la deuxième expérience dépend donc de celui de la première expérience. Dans ce cas, on ne peut pas parler d’échantillon.
2. Simulation de N échantillons aléatoires de taille n d’une expérience à deux issues
a. Obtention d’un échantillon aléatoire de taille n à l’aide d’une simulation sur tableur

Organiser une expérience aléatoire ou une répétition d’expériences aléatoires n’est pas toujours facile.

Exemples
  • Jouer à la roulette nécessite de se déplacer dans un casino ou d’acheter un matériel coûteux.
  • Lancer 100 fois une pièce équilibrée et noter la face obtenue après chaque lancer prend un certain temps.
Simuler une expérience aléatoire, c’est remplacer cette expérience par une autre plus simple à organiser et qui permet d’obtenir des résultats semblables. L’outil informatique peut aider dans cette démarche (programme en langage Python ou logiciel de type tableur).
Exemple
Une urne contient 10 boules blanches et 20 boules noires. On considère l’expérience aléatoire qui consiste à tirer une boule de l’urne, à noter sa couleur (0 pour « blanc » et 1 pour « noir »), puis à la remettre dans l’urne.
Comme il y a 10 boules blanches et 20 boules noires, la probabilité d’obtenir une boule blanche vaut environ 0,33 et celle d’obtenir une boule noire vaut environ 0,67.

On construit avec un tableur un échantillon aléatoire de taille 100 de cette expérience.
Dans B2, on saisit la formule =ENT(ALEA()+0,67) et on recopie cette formule jusqu’en B101. La formule =ENT(ALEA()+0,67) permet d’obtenir 1 avec une probabilité égale à 0,67 et d’obtenir 0 avec une probabilité égale à 0,33.

On obtient ainsi un échantillon de taille 100 de l’expérience :
Rappels
  • La fonction ALEA() permet de générer un nombre compris entre 0 et 1 (1 non compris). ALEA()+0,67 permet donc de générer un nombre compris entre 0,67 et 1,67 (1,67 non compris).
  • La fonction ENT() arrondit à l’entier immédiatement inférieur.
Exemple (suite)

Pour obtenir la fréquence d’apparition de la valeur 1, autrement dit la fréquence d’apparition d’une boule noire, on peut entrer comme ci-dessus la formule =NB.SI(B2:B101;1)/100 dans la cellule B103.
  • =NB.SI(B2:B101;1) indique le nombre de fois où 1 est sorti dans la plage s’étendant de  B2 à B101.
  • La division par 100 donne la fréquence d’apparition de la valeur 1.

Dans cette simulation, une boule noire a été tirée de l’urne 58 fois sur les 100 tirages. Sa fréquence est donc égale à 0,58.

b. Obtention de N échantillons aléatoires de taille n à l’aide d’une simulation sur tableur
Exemple (suite)
En reprenant la feuille de calcul obtenue précédemment, on peut générer autant d’échantillons de taille 100 que l’on souhaite de cette expérience. Par exemple, 500 échantillons de taille 100. Pour cela, on recopie la plage B1:B103 jusqu’à la 501e colonne.
c. Calcul de l’écart entre la fréquence observée et la proportion réelle

Pour chaque échantillon, on peut calculer l’écart entre une fréquence observée dans le tableur et une proportion réelle en utilisant la formule =ABS().

Exemple (suite)
Ici, la proportion réelle de boules noires vaut 0,67.
La fréquence observée de boules noires (en ligne 103, ci-dessous) varie selon les échantillons.
On peut traiter ceci en ligne 105.

On observe ci-dessus que dans l’échantillon 1 (colonne B), l’écart entre la fréquence observée et la proportion réelle vaut 0,03.
Avec le tableur, on peut déterminer le nombre d’échantillons dont l’écart entre la fréquence et la proportion réelle est inférieur ou égal à , c’est-à-dire le nombre d’échantillons pour lesquels la fréquence appartient à l’intervalle .
En utilisant la formule =NB.SI(B105:SG105;”<0,1”)/500, on obtiendra la proportion de cas où l’écart entre la proportion réelle et la fréquence observée est inférieur à 0,1.

Dans cette simulation, dans 96,2 % des cas, la fréquence observée est comprise entre 0,57 et 0,77. L’intervalle [0,57 ; 0,77] est appelé intervalle de fluctuation au seuil de 95 %.
Comme dans 96,2 % des cas, la fréquence se situe dans cet intervalle, on peut affirmer que l’échantillon est représentatif.

Vous avez déjà mis une note à ce cours.

Découvrez les autres cours offerts par Maxicours !

Découvrez Maxicours

Comment as-tu trouvé ce cours ?

Évalue ce cours !

 

quote blanc icon

Découvrez Maxicours

Exerce toi en t’abonnant

Des profs en ligne

  • 6j/7 de 17 h à 20 h
  • Par chat, audio, vidéo
  • Sur les matières principales

Des ressources riches

  • Fiches, vidéos de cours
  • Exercices & corrigés
  • Modules de révisions Bac et Brevet

Des outils ludiques

  • Coach virtuel
  • Quiz interactifs
  • Planning de révision

Des tableaux de bord

  • Suivi de la progression
  • Score d’assiduité
  • Un compte Parent