Statistics Toolbox

Analyse exploratoire des données

La Statistics Toolbox offre de multiples façons d’explorer les données : diagrammes statistiques avec des graphiques interactifs, algorithmes pour les analyses de cluster et statistiques descriptives pour les grands ensembles de données.

Diagrammes statistiques et graphiques interactifs

La Statistics Toolbox inclut des graphiques et des diagrammes permettant d’explorer visuellement les données. La boîte à outils augmente les types de diagrammes MATLAB® avec les diagrammes de probabilité, les diagrammes en boîte, les histogrammes, les histogrammes de nuages de points, les histogrammes 3D, les diagrammes de contrôle et les diagrammes quantile-quantile. La boîte à outils inclut également des diagrammes spécialisés pour les analyses multivariées : les dendrogrammes, les diagrammes de double projection, les diagrammes de coordonnées parallèles et les diagrammes d’Andrews.

Matrice de nuage de points groupée montrant les interactions entre 5 variables.

Matrice de nuage de points groupée montrant les interactions entre 5 variables.

Visualisation des données multivariables (Exemple)
Comment visualiser des données multivariables en utilisant plusieurs graphiques statistiques.

Diagramme en boîte à moustache compact pour réponse groupée par année à la recherche de potentiels effets fixes spécifiques à l’année.

Diagramme en boîte à moustache compact pour réponse groupée par année à la recherche de potentiels effets fixes spécifiques à l’année.

Histogramme en nuage de points à l’aide d’une combinaison de nuages de point et d’histogrammes pour décrire la relation entre les variables.

Histogramme en nuage de points à l’aide d’une combinaison de nuages de point et d’histogrammes pour décrire la relation entre les variables.

Diagramme comparant le CDF empirique pour un échantillon depuis une distribution de valeurs extrêmes avec un diagramme du CDF pour la distribution d’échantillonnage.

Diagramme comparant le CDF empirique pour un échantillon depuis une distribution de valeurs extrêmes avec un diagramme du CDF pour la distribution d’échantillonnage.

Modélisation de données avec la distribution généralisée de valeurs extrêmes (Exemple)
Comment ajuster la distribution généralisée des valeurs extrêmes au moyen d’une estimation du maximum de vraisemblance.

Statistiques descriptives

Les statistiques descriptives permettent de comprendre et de décrire rapidement les grands ensembles de données. La Statistics Toolbox inclut des fonctions pour calculer :

Ces fonctions aident à résumer les valeurs dans un échantillon de données à l’aide de quelques métriques très pertinentes.

Techniques de rééchantillonnage

Dans certains cas, il n’est pas possible d’estimer les statistiques récapitulatives à l’aide de méthodes paramétriques. Pour ces cas-là, la Statistics Toolbox offre des techniques de rééchantillonnage, dont :

  • l’échantillonnage aléatoire à partir d’un ensemble de données avec ou sans remplacement.
  • la fonction généralisée de bootstrap pour l’estimation de statistiques d’échantillon à l’aide du rééchantillonnage.
  • la fonction jackknife pour l’estimation de statistiques d’échantillon à l’aide de sous-ensembles des données.
  • la fonction bootci pour l’estimation des intervalles de confiance.
Point suivant: Régression et ANOVA

Essayer Statistics Toolbox

Obtenir une version d'évaluation

Machine Learning with MATLAB

Visionner le webinar