La régression linéaire

La régression linéaire

La régression linéaire est peut-être l'un des algorithmes les plus connus et les mieux compris en statistique et en apprentissage automatique(Machine

OLTP vs OLAP: quelle est la différence?
Coronavirus au Maroc : quel rôle de l’intelligence artificielle ?
Le bigdata et la sécurité, quel DUO ? Cas du Maroc

La régression linéaire est peut-être l’un des algorithmes les plus connus et les mieux compris en statistique et en apprentissage automatique(Machine learning).

La régression linéaire n’est-elle pas issue des statistiques ?

Avant de nous plonger dans les détails de la régression linéaire, vous vous demandez peut-être pourquoi nous examinons cet algorithme.

N’est-ce pas une technique statistique?

L’apprentissage automatique, plus précisément le domaine de la modélisation prédictive, vise principalement à minimiser l’erreur d’un modèle ou à rendre les prédictions les plus précises possibles, au détriment de l’explicabilité. Dans l’apprentissage automatique appliqué, nous emprunterons, réutiliserons et volerons des algorithmes dans de nombreux domaines différents, y compris les statistiques, et les utiliserons à ces fins.

En tant que telle, la régression linéaire a été développée dans le domaine des statistiques et est étudiée comme modèle pour comprendre la relation entre les variables numériques d’entrée et de sortie, mais a été empruntée par l’apprentissage automatique. Il s’agit à la fois d’un algorithme statistique et d’un algorithme d’apprentissage automatique.

Ensuite, passons en revue certains des noms communs utilisés pour faire référence à un modèle de régression linéaire.

Nombreux noms de régression linéaire

Lorsque vous commencez à étudier la régression linéaire, les choses peuvent devenir très confuses.

La raison en est que la régression linéaire existe depuis si longtemps (plus de 200 ans). Il a été étudié sous tous les angles possibles et souvent chaque angle a un nom nouveau et différent.

La régression linéaire est un modèle linéaire , par exemple un modèle qui suppose une relation linéaire entre les variables d’entrée (x) et la variable de sortie unique (y). Plus précisément, que y peut être calculé à partir d’une combinaison linéaire des variables d’entrée (x).

Lorsqu’il n’y a qu’une seule variable d’entrée (x), la méthode est appelée régression linéaire simple . Lorsqu’il existe plusieurs variables d’entrée , la littérature statistique fait souvent référence à la méthode comme une régression linéaire multiple.

Différentes techniques peuvent être utilisées pour préparer ou entraîner l’équation de régression linéaire à partir de données, dont la plus courante est appelée les moindres carrés ordinaires . Il est donc courant de se référer à un modèle préparé de cette façon comme régression linéaire des moindres carrés ordinaires ou simplement régression des moindres carrés.

Maintenant que nous connaissons certains noms utilisés pour décrire la régression linéaire, examinons de plus près la représentation utilisée.

 

COMMENTS