Régression sur composantes principales

Cet article est une ébauche concernant les probabilités et la statistique et l’informatique.

Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.

Consultez la liste des tâches à accomplir en page de discussion.

En statistiques, la régression sur composantes principales est une analyse en régression sur les composantes d'une analyse en composantes principales. On utilise souvent cette technique lorsque les variables explicatives sont proches d'être colinéaires, lorsque par exemple le nombre de variables est très supérieur au nombre d'individus. La régression sur composantes principales est souvent comparée à la régression PLS^{[i 1]}.

Principe

La méthode se déroule en trois phases :

Analyse en composantes principales sur les variables explicatives
Régression linéaire de la variable dépendante (ou variable à expliquer) sur la partie des composantes la plus corrélée à celle-ci
Calcul des paramètres de la régression en fonction des variables d'origines^{[b 1]}.

Notes et références

Notes

(en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Principal component regression » (voir la liste des auteurs).

Références

Ouvrages spécialisés

↑ Tenenhaus 1998, p. 41

Articles publiés sur internet

↑ (en) [PDF] The MathWorks, Inc., « « Partial Least Squares Regression and Principal Components Regression » » (consulté le 10 janvier 2012)

Voir aussi

Bibliographie

(fr) Michel Tenenhaus, La régression PLS : Théorie et Pratique, Paris, éditions Technip, 1998, 254 p. (ISBN 978-2-7108-0735-3, lire en ligne)

Articles connexes

Liens internes

Liens externes

La Régression sur composantes principales sur YouTube

v · m

Index du projet probabilités et statistiques

Théorie des probabilités

Bases théoriques

Principes généraux	Axiomes des probabilités Espace probabilisable Probabilité Événement Tribu Indépendance Variable aléatoire Espérance Variables iid
Convergence de lois	Théorème central limite Loi des grands nombres Théorème de Borel-Cantelli
Calcul stochastique	Marche aléatoire Chaîne de Markov Processus stochastique Processus de Markov Martingale Mouvement brownien Équation différentielle stochastique

Lois de probabilité

Lois continues	Loi exponentielle Loi normale Loi uniforme Loi de Student Loi de Fisher Loi du χ²
Lois discrètes	Loi de Bernoulli Loi binomiale Loi de Poisson Loi géométrique Loi hypergéométrique

Mélange entre statistiques et probabilités

Intervalle de confiance

Interprétations de la probabilité

Bayésianisme

Théorie des statistiques

Statistiques descriptives

Bases théoriques	Une statistique Caractère Échantillon Erreur type Intervalle de confiance Fonction de répartition empirique Théorème de Glivenko-Cantelli Inférence bayésienne Régression linéaire Méthode des moindres carrés Analyse des données Corrélation
Tableaux	Tableau de contingence Tableau disjonctif complet Table de Burt
Visualisation de données	Histogramme Diagramme à barres Graphique en aires Diagramme circulaire Treemap Boîte à moustaches Nuage de points Graphique à bulles Diagramme en cascade Graphique en entonnoir Diagramme de Kiviat Corrélogramme Graphique en forêt Diagramme branche-et-feuille Heat map Sparkline
Paramètres de position	Moyenne arithmétique Mode Médiane Quantile Quartile Décile Centile
Paramètres de dispersion	Étendue Écart moyen Variance Écart type Déviation absolue moyenne Écart interquartile Coefficient de variation
Paramètres de forme	Coefficient d'asymétrie Coefficient d'aplatissement

Statistiques inductives

Bases théoriques	Hypothèse nulle Estimateur Signification statistique Sensibilité et spécificité Courbe ROC Nombre de sujets nécessaires Valeur p Contraste (statistiques) Statistique de test Taille d'effet Puissance statistique
Tests paramétriques	Test d'hypothèse Test de Bartlett Test de normalité Test de Fisher d'égalité de deux variances Test d'Hausman Test d'Anderson-Darling Test de Banerji Test de Durbin-Watson Test de Goldfeld et Quandt Test de Jarque-Bera Test de Mood Test de Lilliefors Test de Wald Test T pour des échantillons indépendants Test T pour des échantillons appariés Test de corrélation de Pearson
Tests non-paramétriques	Test U de Mann-Whitney Test de Kruskal-Wallis Test exact de Fisher Test de Kolmogorov-Smirnov Test de Shapiro-Wilk Test de Chow Test de McNemar Test de Spearman Tau de Kendall Test Gamma Test des suites de Wald-Wolfowitz Test de la médiane Test des signes ANOVA de Friedman Concordance de Kendall Test Q de Cochran Test des rangs signés de Wilcoxon Test de Sargan