Fiche de cours

La droite de régression : la méthode des moindres carrés

Lycée   >   Terminale   >   Mathématiques complémentaires   >   La droite de régression : la méthode des moindres carrés

  • Fiche de cours
  • Quiz et exercices
  • Vidéos et podcasts
Objectifs
  • Calculer et interpréter un coefficient de corrélation.
  • Déterminer une droite de régression par la méthode des moindres carrés.
  • Effectuer un ajustement se ramenant, par changement de variable, à un ajustement affine.
  • Dans le cadre d’une résolution de problème, utiliser un ajustement pour interpoler ou extrapoler.
Points clés
  • Soit une série statistique à deux variables x et y. Pour savoir si un ajustement affine est envisageable, on peut utiliser le coefficient de corrélation linéaire de la série, noté r, avec r = σx et σy sont les écarts-types respectifs des séries x et y, et σxy la covariance des séries x et y.
  • r est un nombre compris entre 1 et 1. Plus il est proche de ces deux valeurs, plus l’ajustement affine est pertinent. En revanche, plus il est proche de 0, moins il l’est. De plus, si r est très proche de 1, la droite d’ajustement affine est croissante, et si r est très proche de 1, elle est décroissante.
  • Pour déterminer l'équation de la droite d'ajustement d'un nuage de points donné, on peut utiliser une méthode basée sur la minimisation des carrés des écarts entre les points du nuage et des points de la droite d'ajustement. La méthode des moindres carrés consiste à déterminer la droite dite « de régression de y en x » qui rend minimale la somme .
    Les coefficients a et b de l’équation de cette droite sont définis par a =  et , où σx est l’écart-type de la série x, et σxy la covariance des séries x et y.
Pour bien comprendre
  • Représenter un nuage de points.
  • Calculer les coordonnées d’un point moyen.
  • Connaitre les fonctions polynôme, exponentielle et logarithme.
1. Rappels : nuage de points et ajustement affine
On considère les points du nuage associés à une série statistique double.
Lorsque ces points sont sensiblement alignés, on peut construire une droite passant « au plus près de ces points ». On dit alors que cette droite réalise un ajustement affine du nuage de points de la série statistique double.
Exemple
Les points du nuage représenté ci-dessous sont presque alignés.
Remarque
Se référer à la fiche « Point moyen et droite d’ajustement » pour plus de précisions.
2. Coefficient de corrélation linéaire
Soit une série statistique à deux variables x et y. Pour savoir si un ajustement affine est envisageable, on peut utiliser le coefficient de corrélation linéaire de la série, noté r, avec r = σx et σy sont les écarts-types respectifs des séries x et y, et σxy la covariance des séries x et y.

r est un nombre compris entre 1 et 1. Plus il est proche de ces deux valeurs, plus l’ajustement affine est pertinent. En revanche, plus il est proche de 0, moins il l’est.

De plus, si r est très proche de 1, la droite d’ajustement affine est croissante et si r est très proche de 1, elle est décroissante.

Remarque
On peut utiliser la calculatrice pour calculer le coefficient de corrélation linéaire.
Exemple
On considère la série statistique suivante.
xi 100 110 120 130 140 150 160
yi 105 95 75 68 53 46 31

Sur la calculatrice (ici, la TI-83 Premium CE) :

  1. Entrer dans le menu Stats.
  2. Entrer les deux listes de données dans l'éditeur de listes.
  3. Revenir dans le menu Stats et sélectionner CALC puis 4:RégLin(ax+b).
  4. Compléter l’écran, puis valider Calculer.
  5. L’écran suivant s’affiche et on peut lire la valeur de r.
Ici, le coefficient de corrélation r  –0,994 : il est très proche de –1, ce qui signifie que l’ajustement linéaire est pertinent.
Remarque
Avec la calculatrice Casio Graph 90+E, on utilise le menu Statistique, puis on entre les valeurs de la série dans les colonnes List1 et List2. Après avoir vérifié les réglages, on appuie sur REG, puis F1 X puis F1 pour obtenir le coefficient de corrélation linéaire.
3. La méthode « des moindres carrés »

Pour déterminer l'équation de la droite d'ajustement d'un nuage de points donné, on préférera utiliser une méthode basée sur la minimisation des carrés des écarts entre les points du nuage et des points de la droite d'ajustement.

La méthode des moindres carrés consiste à déterminer la droite dite « de régression de y en x » qui rend minimale la somme : .
Remarque
Dans la pratique, on détermine cette droite de régression de y en x, d'équation y = ax + b, à l'aide de la calculatrice.
Propriété
Les coefficients a et b de l’équation de cette droite sont définis par a =  et b = , où σx est l’écart-type de la série x, et σxy la covariance des séries x et y.
Remarque importante
Par définition, la droite de régression de y en x du nuage passe toujours par le point moyen du nuage de la série.
Exemple
On considère la série statistique de l'exemple précédent.
xi 100 110 120 130 140 150 160
yi 105 95 75 68 53 46 31

Avec les mêmes manipulations sur la calculatrice (ici, la TI-83 Premium CE), on a obtenu l’écran suivant.

En plus du coefficient de corrélation, on obtient directement sur cet écran les coefficients a et b, ce qui donne pour équation de la droite de régression y = –1,221x + 226,357 en arrondissant au millième.
Remarque
On pourrait aussi trouver ces coefficients par le calcul.
À titre d'exemple, ici on a :

 

 

 

Alors .

4. Changement de variable et régression linéaire

Parfois, le nuage de points obtenu à partir d’une série statistique à deux variables peut ne pas avoir l’allure d’une fonction affine et ne peut donc pas être ajusté par une droite de régression. En revanche, il peut avoir l’allure d’une fonction polynôme, d’une fonction exponentielle ou encore d’une fonction logarithme.
On procède dans ce cas à un changement de variable z = f (y), amenant à une nouvelle série à deux variables pouvant être ajustée par une droite de régression avant de revenir à la variable initiale.

Exemple
Soit la série statistique suivante.
x 40 60 80 100 120 140 160
y 2,1 2,4 2,9 3,5 4,3 5,3 6,5
Et son nuage de points associé :

Ces points ne semblent pas être à peu près alignés. Si on effectue le changement de variable z = , on obtient une nouvelle série :
x 40 60 80 100 120 140 160
z =  0,316 0,632 0,949 1,225 1,517 1,817 2,121

Et son nuage de points :

Cette fois, les points semblent alignés et un ajustement affine parait pertinent. En utilisant la calculatrice, on obtient :

L’équation de la droite de régression est donc z = 0,015 x – 0,266 (arrondi au millième).
Et comme z = , alors y = (0,015 x – 0,266)2 + 2.

Évalue ce cours !

 

Des quiz et exercices pour mieux assimiler sa leçon

La plateforme de soutien scolaire en ligne myMaxicours propose des quiz et exercices en accompagnement de chaque fiche de cours. Les exercices permettent de vérifier si la leçon est bien comprise ou s’il reste encore des notions à revoir.

S’abonner

 

Des exercices variés pour ne pas s’ennuyer

Les exercices se déclinent sous toutes leurs formes sur myMaxicours ! Selon la matière et la classe étudiées, retrouvez des dictées, des mots à relier ou encore des phrases à compléter, mais aussi des textes à trous et bien d’autres formats !

Dans les classes de primaire, l’accent est mis sur des exercices illustrés très ludiques pour motiver les plus jeunes.

S’abonner

 

Des quiz pour une évaluation en direct

Les quiz et exercices permettent d’avoir un retour immédiat sur la bonne compréhension du cours. Une fois toutes les réponses communiquées, le résultat s’affiche à l’écran et permet à l’élève de se situer immédiatement.

myMaxicours offre des solutions efficaces de révision grâce aux fiches de cours et aux exercices associés. L’élève se rassure pour le prochain examen en testant ses connaissances au préalable.

S’abonner

Des vidéos et des podcasts pour apprendre différemment

Certains élèves ont une mémoire visuelle quand d’autres ont plutôt une mémoire auditive. myMaxicours s’adapte à tous les enfants et adolescents pour leur proposer un apprentissage serein et efficace.

Découvrez de nombreuses vidéos et podcasts en complément des fiches de cours et des exercices pour une année scolaire au top !

S’abonner

 

Des podcasts pour les révisions

La plateforme de soutien scolaire en ligne myMaxicours propose des podcasts de révision pour toutes les classes à examen : troisième, première et terminale.

Les ados peuvent écouter les différents cours afin de mieux les mémoriser en préparation de leurs examens. Des fiches de cours de différentes matières sont disponibles en podcasts ainsi qu’une préparation au grand oral avec de nombreux conseils pratiques.

S’abonner

 

Des vidéos de cours pour comprendre en image

Des vidéos de cours illustrent les notions principales à retenir et complètent les fiches de cours. De quoi réviser sa prochaine évaluation ou son prochain examen en toute confiance !

S’abonner

Découvrez le soutien scolaire en ligne avec myMaxicours

Plongez dans l'univers de myMaxicours et découvrez une approche innovante du soutien scolaire en ligne, conçue pour captiver et éduquer les élèves de CP à la terminale. Notre plateforme se distingue par une riche sélection de contenus interactifs et ludiques, élaborés pour stimuler la concentration et la motivation à travers des parcours d'apprentissage adaptés à chaque tranche d'âge. Chez myMaxicours, nous croyons en une éducation où chaque élève trouve sa place, progresse à son rythme et développe sa confiance en soi dans un environnement bienveillant.

Profitez d'un accès direct à nos Profs en ligne pour une assistance personnalisée, ou explorez nos exercices et corrigés pour renforcer vos connaissances. Notre assistance scolaire en ligne est conçue pour vous accompagner à chaque étape de votre parcours éducatif, tandis que nos vidéos et fiches de cours offrent des explications claires et concises sur une multitude de sujets. Avec myMaxicours, avancez sereinement sur le chemin de la réussite scolaire, armé des meilleurs outils et du soutien de professionnels dédiés à votre épanouissement académique.

Fiches de cours les plus recherchées

Mathématiques complémentaires

Les variables numériques - spé maths complémentaires

Mathématiques complémentaires

Les variables non numériques - Terminale

Mathématiques complémentaires

Les instructions d'entrée et de sortie - Terminale

Mathématiques complémentaires

L'instruction if - spé maths complémentaires

Mathématiques complémentaires

La boucle while - spé maths complémentaires

Mathématiques complémentaires

Les calculs - Terminale

Mathématiques complémentaires

Comprendre, compléter et modifier un programme - spécialité maths complémentaires

Mathématiques complémentaires

Les fonctions simples - Terminale

Mathématiques complémentaires

Les fonctions complexes - Terminale

Mathématiques complémentaires

Les expériences aléatoires