La droite de régression : la méthode des moindres carrés
- Fiche de cours
- Quiz et exercices
- Vidéos et podcasts
- Calculer et interpréter un coefficient de corrélation.
- Déterminer une droite de régression par la méthode des moindres carrés.
- Effectuer un ajustement se ramenant, par changement de variable, à un ajustement affine.
- Dans le cadre d’une résolution de problème, utiliser un ajustement pour interpoler ou extrapoler.
- Soit une série statistique à deux variables x et y. Pour savoir si un ajustement affine est envisageable, on peut utiliser le coefficient de corrélation linéaire de la série, noté r, avec r = où σx et σy sont les écarts-types respectifs des séries x et y, et σxy la covariance des séries x et y.
- r est un nombre compris entre –1 et 1. Plus il est proche de ces deux valeurs, plus l’ajustement affine est pertinent. En revanche, plus il est proche de 0, moins il l’est. De plus, si r est très proche de 1, la droite d’ajustement affine est croissante, et si r est très proche de –1, elle est décroissante.
- Pour déterminer l'équation de la droite
d'ajustement d'un nuage de points donné, on peut
utiliser une méthode basée sur la
minimisation des carrés des écarts entre les
points du nuage et des points de la droite d'ajustement. La
méthode des moindres carrés consiste à
déterminer la droite dite « de
régression de y en x » qui rend
minimale la somme .
- Représenter un nuage de points.
- Calculer les coordonnées d’un point moyen.
- Connaitre les fonctions polynôme, exponentielle et logarithme.
Lorsque ces points sont sensiblement alignés, on peut construire une droite passant « au plus près de ces points ». On dit alors que cette droite réalise un ajustement affine du nuage de points de la série statistique double.
Les points du nuage représenté ci-dessous sont presque alignés.
Se référer à la fiche « Point moyen et droite d’ajustement » pour plus de précisions.
r est un nombre compris entre –1 et 1. Plus il est proche de ces deux valeurs, plus l’ajustement affine est pertinent. En revanche, plus il est proche de 0, moins il l’est.
De plus, si r est très proche de 1, la droite d’ajustement affine est croissante et si r est très proche de –1, elle est décroissante.
On peut utiliser la calculatrice pour calculer le coefficient de corrélation linéaire.
On considère la série statistique suivante.
xi | 100 | 110 | 120 | 130 | 140 | 150 | 160 |
yi | 105 | 95 | 75 | 68 | 53 | 46 | 31 |
Sur la calculatrice (ici, la TI-83 Premium CE) :
- Entrer dans le menu Stats.
- Entrer les deux listes de données dans
l'éditeur de listes.
- Revenir dans le menu
Stats et sélectionner CALC puis 4:RégLin(ax+b).
- Compléter l’écran, puis valider
Calculer.
- L’écran suivant s’affiche et on
peut lire la valeur de r.
Avec la calculatrice Casio Graph 90+E, on utilise le menu Statistique, puis on entre les valeurs de la série dans les colonnes List1 et List2. Après avoir vérifié les réglages, on appuie sur REG, puis F1 X puis F1 pour obtenir le coefficient de corrélation linéaire.
Pour déterminer l'équation de la droite d'ajustement d'un nuage de points donné, on préférera utiliser une méthode basée sur la minimisation des carrés des écarts entre les points du nuage et des points de la droite d'ajustement.
Dans la pratique, on détermine cette droite de régression de y en x, d'équation y = ax + b, à l'aide de la calculatrice.
Les coefficients a et b de l’équation de cette droite sont définis par a = et b = , où σx est l’écart-type de la série x, et σxy la covariance des séries x et y.
Par définition, la droite de régression de y en x du nuage passe toujours par le point moyen du nuage de la série.
On considère la série statistique de l'exemple précédent.
xi | 100 | 110 | 120 | 130 | 140 | 150 | 160 |
yi | 105 | 95 | 75 | 68 | 53 | 46 | 31 |
Avec les mêmes manipulations sur la calculatrice (ici, la TI-83 Premium CE), on a obtenu l’écran suivant.
On pourrait aussi trouver ces coefficients par le calcul.
À titre d'exemple, ici on a :
Alors .
Parfois, le nuage de points obtenu à partir
d’une série statistique à deux
variables peut ne pas avoir l’allure d’une
fonction affine et ne peut donc pas être
ajusté par une droite de régression. En
revanche, il peut avoir l’allure d’une
fonction polynôme, d’une fonction
exponentielle ou encore d’une fonction
logarithme.
On procède dans ce cas à un changement de
variable z = f (y),
amenant à une nouvelle série à deux
variables pouvant être ajustée par une
droite de régression avant de revenir à la
variable initiale.
Soit la série statistique suivante.
x | 40 | 60 | 80 | 100 | 120 | 140 | 160 |
y | 2,1 | 2,4 | 2,9 | 3,5 | 4,3 | 5,3 | 6,5 |
Ces points ne semblent pas être à peu près alignés. Si on effectue le changement de variable z = , on obtient une nouvelle série :
x | 40 | 60 | 80 | 100 | 120 | 140 | 160 |
z = | 0,316 | 0,632 | 0,949 | 1,225 | 1,517 | 1,817 | 2,121 |
Et son nuage de points :
Cette fois, les points semblent alignés et un ajustement affine parait pertinent. En utilisant la calculatrice, on obtient :
L’équation de la droite de régression est donc z = 0,015 x – 0,266 (arrondi au millième).
Et comme z = , alors y = (0,015 x – 0,266)2 + 2.
Des quiz et exercices pour mieux assimiler sa leçon
La plateforme de soutien scolaire en ligne myMaxicours propose des quiz et exercices en accompagnement de chaque fiche de cours. Les exercices permettent de vérifier si la leçon est bien comprise ou s’il reste encore des notions à revoir.
Des exercices variés pour ne pas s’ennuyer
Les exercices se déclinent sous toutes leurs formes sur myMaxicours ! Selon la matière et la classe étudiées, retrouvez des dictées, des mots à relier ou encore des phrases à compléter, mais aussi des textes à trous et bien d’autres formats !
Dans les classes de primaire, l’accent est mis sur des exercices illustrés très ludiques pour motiver les plus jeunes.
Des quiz pour une évaluation en direct
Les quiz et exercices permettent d’avoir un retour immédiat sur la bonne compréhension du cours. Une fois toutes les réponses communiquées, le résultat s’affiche à l’écran et permet à l’élève de se situer immédiatement.
myMaxicours offre des solutions efficaces de révision grâce aux fiches de cours et aux exercices associés. L’élève se rassure pour le prochain examen en testant ses connaissances au préalable.
Des vidéos et des podcasts pour apprendre différemment
Certains élèves ont une mémoire visuelle quand d’autres ont plutôt une mémoire auditive. myMaxicours s’adapte à tous les enfants et adolescents pour leur proposer un apprentissage serein et efficace.
Découvrez de nombreuses vidéos et podcasts en complément des fiches de cours et des exercices pour une année scolaire au top !
Des podcasts pour les révisions
La plateforme de soutien scolaire en ligne myMaxicours propose des podcasts de révision pour toutes les classes à examen : troisième, première et terminale.
Les ados peuvent écouter les différents cours afin de mieux les mémoriser en préparation de leurs examens. Des fiches de cours de différentes matières sont disponibles en podcasts ainsi qu’une préparation au grand oral avec de nombreux conseils pratiques.
Des vidéos de cours pour comprendre en image
Des vidéos de cours illustrent les notions principales à retenir et complètent les fiches de cours. De quoi réviser sa prochaine évaluation ou son prochain examen en toute confiance !