Statistics Toolbox

Statistiques multivariées

Les statistiques multivariées offrent des algorithmes et des fonctions pour analyser plusieurs variables. Les applications classiques incluent :

  • la transformation de données corrélées dans un ensemble de composants non corrélés à l'aide de rotation et de centrage (analyse en composantes principales) ;
  • l'exploration des relations entre les variables à l'aide de techniques de visualisation, telles que les matrices de nuages de points et le cadrage multidimensionnel classique ;
  • la segmentation de données avec les analyses de cluster.
Exemple : ajustement d'une régression orthogonale à l'aide d'une analyse en composantes principales

Ajustement d'une régression orthogonale à l'aide d'une analyse en composantes principales (Exemple)
Mise en œuvre de la régression de Deming (moindres carrés total).

Transformation de fonctions

Les techniques de transformation de fonctions permettent la réduction de dimensionnalité lorsque les fonctions transformées peuvent être ordonnées plus facilement que les fonctions initiales. Statistics Toolbox offre trois classes d'algorithmes de transformation de fonctions :

  • analyse en composantes principales pour le résumé des données en réduisant les dimensions ;
  • factorisation de matrice non négative lorsque les termes du modèle représentent des quantités non négatives ;
  • analyse factorielle pour la construction de modèles explicatifs de corrélation des données.
Exemple : régression partielle des moindres carrés et régression en composantes principales.

Régression partielle des moindres carrés et régression en composantes principales (Exemple)
Modélisation d'une variable de réponse en présence de prédicteurs hautement corrélés.

Visualisation multivariée

Statistics Toolbox propose des graphiques et des diagrammes pour explorer visuellement des données multivariées, y compris :

  • des matrices de nuages de points ;
  • des dendogrammes ;
  • des diagrammes de double projection ;
  • des diagrammes de coordonnées parallèles ;
  • des graphiques d'Andrews ;
  • des diagrammes glyphes.
Matrice de nuage de points groupée montrant comment l'année modèle a un impact sur les différentes variables.

Matrice de nuage de points groupée montrant comment l'année modèle a un impact sur les différentes variables.

Diagramme de double projection montrant les trois premiers chargements à partir de l'analyse en composantes principales.

Diagramme de double projection montrant les trois premiers chargements à partir de l'analyse en composantes principales.

Diagramme d'Andrews montrant comment le pays d'origine a un impact sur les variables.

Diagramme d'Andrews montrant comment le pays d'origine a un impact sur les variables.

Analyse de cluster

Statistics Toolbox offre de nombreux algorithmes pour les analyses de clustering, incluant :

  • la mise en cluster hiérarchique, qui crée un cluster agglomératif généralement représenté par un arbre ;
  • les algorithmes de k-means qui attribuent des points de données aux cluster avec la moyenne la plus proche ;
  • des mélanges gaussiens qui sont formés par la combinaisons de composants de densité normale multivariés ; des clusters sont attribués en sélectionnant le composant qui optimise la probabilité postérieure.
Modèle de mélange gaussien à deux composants qui s'adapte à un mélange de gaussiennes bivariées.

Modèle de mélange gaussien à deux composants qui s'adapte à un mélange de gaussiennes bivariées.

Sortie à partir de l'application d'un algorithme de mise en cluster au même exemple.

Sortie à partir de l'application d'un algorithme de mise en cluster au même exemple.

Dendogramme qui affiche un modèle avec 4 clusters.

Dendogramme qui affiche un modèle avec 4 clusters.

Point suivant: Distribution de probabilités

Essayer Statistics Toolbox

Obtenir une version d'évaluation

Multilevel Mixed-Effects Modeling Using MATLAB

Visionner le webinar