Statistics Toolbox

Analyse exploratoire des données

Statistics Toolbox offre de multiples façons d'explorer les données : diagrammes statistiques avec des graphiques interactifs, algorithmes pour les analyses de cluster et statistiques descriptives pour les grands ensembles de données.

Diagrammes statistiques et graphiques interactifs

Statistics Toolbox inclut des graphiques et des diagrammes permettant d'explorer visuellement les données. La boîte à outils augmente les types de diagrammes MATLAB® avec les diagrammes de probabilité, les diagrammes en boîte, les histogrammes, les histogrammes de nuages de points, les histogrammes 3D, les diagrammes de contrôle et les diagrammes quantile-quantile. La boîte à outils inclut également des diagrammes spécialisés pour les analyses multivariées : les dendogrammes, les diagrammes de double projection, les diagrammes de coordonnées parallèles, et les diagrammes d'Andrews.

Matrice de nuage de points groupée montrant les interactions entre 5 variables.

Matrice de nuage de points groupée montrant les interactions entre 5 variables.

Diagramme en boîte à moustache compact offrant un résumé de l'ensemble des données à 5 chiffres.

Diagramme en boîte à moustache compact offrant un résumé de l'ensemble des données à 5 chiffres.

Histogramme en nuage de points à l'aide d'une combinaison de nuages de point et d'histogrammes pour décrire la relation entre les variables.

Histogramme en nuage de points à l'aide d'une combinaison de nuages de point et d'histogrammes pour décrire la relation entre les variables.

Diagramme comparant le CDF empirique pour un échantillon depuis une distribution de valeurs extrêmes avec un diagramme du CDF pour la distribution d'échantillonnage.

Diagramme comparant le CDF empirique pour un échantillon depuis une distribution de valeurs extrêmes avec un diagramme du CDF pour la distribution d'échantillonnage.

Analyse de cluster

Statistics Toolbox offre des algorithmes multiples pour analyser les données à l'aide de clustering hiérarchiques, d'algorithmes de k-means et de mélanges gaussiens.

Modèle de mélange gaussien à deux composants qui s'adapte à un mélange de gaussiennes bivariées.

Modèle de mélange gaussien à deux composants qui s'adapte à un mélange de gaussiennes bivariées.

Sortie à partir de l'application d'un algorithme de mise en cluster au même exemple.

Sortie à partir de l'application d'un algorithme de mise en cluster au même exemple.

Dendogramme qui affiche un modèle avec 4 clusters.

Dendogramme qui affiche un modèle avec 4 clusters.

Exemple : Analyse de cluster

Analyse de cluster (Exemple)
Utilisation des algorithmes de k-means et de mise en cluster hiérarchique pour découvrir les groupements naturels dans les données.

Statistiques descriptives

Les statistiques descriptives permettent de comprendre et de décrire rapidement et potentiellement les grands ensembles de données. Statistics Toolbox inclut des fonctions pour calculer :

  • les mesures de la tendance centrale (mesure d'emplacement), y compris la moyenne, la médianne et différentes moyennes ;
  • les mesures de dispersion (mesures de répartition), y compris la plage, la variance, l'écart-type, et l'écart absolu moyen ou médian ;
  • la corrélation linéaire ou de rang (partielle et complète) ;
  • les résultats qui reposent sur les données avec des valeurs manquantes ;
  • l'estimation des centiles et quartiles ;
  • les estimations de densité à l'aide de la fonction de filtrage de noyaux.

Ces fonctions aident à résumer les valeurs dans un échantillon de données à l'aide de quelques nombres très pertinents.

Dans certains cas, il n'est pas possible d'estimer les statistiques récapitulatives à l'aide de méthodes paramétriques. Pour ces cas-là, Statistics Toolbox offre des techniques de rééchantillonage, dont :

  • la fonction généralisée de bootstrap pour l'estimation de statistiques d'échantillon à l'aide du rééchantillonage ;
  • la fonction jackknife pour l'estimation de statistiques d'échantillon à l'aide de sous-ensembles des données ;
  • la fonction bootci pour l'estimation d'intervalles de confiance.
Point suivant: Régression, classification et ANOVA

Essayer Statistics Toolbox

Obtenir une version d'évaluation

Multilevel Mixed-Effects Modeling Using MATLAB

Visionner le webinar