Les modèles graphiques gaussiens permettent d'inférer et de visualiser les dépendances entre des variables. Ces modèles sont difficiles à estimer lorsque la taille de l'échantillon est plus petite que le nombre de variables. Afin de réduire la dimension du problème, nous proposons une procédure de sélection de modèle non-asymptotique: nous approchons la matrice de covariance par une matrice diagonale par blocs. Pour détecter la structure de cette matrice, nous seuillons la matrice de covariance empirique, le seuil étant choisi à l'aide de l'heuristique de pente. Grâce à cette structure, le problème d'estimation est décomposé en plusieurs sous-problèmes indépendants : dans chaque bloc, nous inférons les dépendances entre variables à l'aide du graphical Lasso. Cette méthode est implémentée dans le package shock (Slope Heuristic blOCK diagonal covariance selection). Dans ce "lightning talk", nous exposerons ce package et l'intérêt de son utilisation.
- Présentation