Statistics Toolbox

Régression, classification et ANOVA

Régression

Avec la régression, il est possible de modéliser une variable de réponse continue comme une fonction d'un prédicteur ou plus. Statistics Toolbox offre une large variété d'algorithmes de régression, dont :

  • régression linéraire ;
  • régression non linéraire ;
  • régression robuste ;
  • régression logistique et autres modèles linéaires généralisés.

Ajustement avec MATLAB : statistiques, optimisation et ajustement de courbes 38:37
Application d'algorithmes de régression avec MATLAB.

Vous pouvez évaluer la qualité de l'ajustement à l'aide d'une variété de valeurs qui inclut :

  • R2 et R2 ajusté ;
  • l'erreur quadratique moyenne par validation croisée ;
  • le critère d'information Akaike (AIC) et le critère d'information Bayesian (BIC).

Avec la boîte à outils, il est possible de calculer les intervalles de confiance pour les coefficients de régression et les valeurs prévues.

Statistics Toolbox prend en charge des techniques plus avancées pour améliorer l'exactitude prédictive lorsque l'ensemble de données inclut un grand nombre de variables corrélées. La boîte à outils prend en charge :

  • des techniques de sélection de sous-ensemble, y compris la sélection des fonctions séquentielle et la régression pas à pas ;
  • des méthodes de régularisation, qui incluent la régression ridge, le lasso et l'elastic net.

Statistique computationnelle : sélection des fonctions, régularisation et diminution avec MATLAB 36:51
Génération d'ajustements précis en présence de données corrélées.

Statistics Toolbox prend également en charge les techniques de régression non paramétriques pour la génération d'ajustements précis sans modèle spécifié décrivant la relation entre le prédicteur et la réponse. Les techniques de régression non paramétriques incluent les arbres de décision ainsi que les arbres de régression de boosting et de bagging.

Ajustement non paramétrique 4:07
Développez un modèle prédictif lorsque vous ne pouvez pas définir de fonction décrivant les relations entre les variables.

De plus, Statistics Toolbox prend en charge les modèles non-linéaires à effets mixtes (NLME) dans lesquels certains paramètres de la fonction non linéaire varient selon les groupes ou les individus.

Modèle non-linéaire à effets mixtes de l'absorption et de l'élimination de drogues qui montre les profils intra-sujet de concentration par rapport au temps.

Modèle non-linéaire à effets mixtes de l'absorption et de l'élimination de drogues qui montre les profils intra-sujet de concentration par rapport au temps. La fonction nlmefit dans Statistics Toolbox génère un modèle de remplissage à l'aide d'effets fixes et aléatoires.

Classification

Les algorithmes de classification permettent de modéliser une variable de réponse catégorique comme une fonction d'un prédicteur ou plus. Statistics Toolbox offre un grand éventail d'algorithmes de classification paramétriques et non paramétriques, tels que :

  • les arbres de classification de boosting et bagging,qui incluent AdaBoost, LogitBoost, GentleBoost, et RobustBoost ;
  • la classification Naïve bayésienne ;
  • la classification du plus proche voisin K ;
  • l'analyse du discriminant linéaire.

Introduction à la classification 9:00
Développez des modèle prédictifs pour classifier les données.

Vous pouvez évaluer la qualité de l'ajustement pour les modèles de classification résultant à l'aide de techniques telles que :

  • la perte par validation croisée ;
  • les matrices de confusion ;
  • les courbes de performance/courbes ROC.

ANOVA

L'analyse de la variance (ANOVA) permet d'attribuer une variance d'un échantillon à différentes sources et de déterminer si la variation survient dans ou entre les différents groupes de population. Statistics Toolbox inclut ces algoritmes ANOVA et des techniques associées :

  • ANOVA à un facteur ;
  • ANOVA à deux facteurs pour des données équilibrées ;
  • ANOVA à critères multiples pour les données équilibrées et non équilibrées ;
  • ANOVA multivariée (MANOVA) ;
  • ANOVA à un facteur et à deux facteurs non paramétriques (de Kruskal-Wallis ou de Friedman) ;
  • analyse de la covariance (ANOCOVA) ;
  • comparaison multiple de moyennes, de pentes et d'intersections de groupe.
Point suivant: Statistiques multivariées

Essayer Statistics Toolbox

Obtenir une version d'évaluation

Multilevel Mixed-Effects Modeling Using MATLAB

Visionner le webinar