Rencontres R 2016 - Sciencesconf.org

sciencesconf.org:r2016-toulouse:109544

Forêts aléatoires pour l'apprentissage de données massives

Robin Genuer 1, *, @ , Jean-Michel Poggi 2, @ , Christine Tuleau-Malot 3, @ , Nathalie Villa-Vialaneix 4, @

1 : INRIA, SISTM team & ISPED, INSERM U-897

Université de Bordeaux (Bordeaux, France)

2 : Laboratoire de Mathématiques d'Orsay (LM-Orsay) - Site web

CNRS : UMR8628, Université Paris XI - Paris Sud

3 : Laboratoire Jean Alexandre Dieudonné (JAD) - Site web

Université Nice Sophia Antipolis (UNS), CNRS : UMR7351

Université de Nice - Sophia Antipolis U.M.R. no 6621 du C.N.R.S. Parc Valrose 06108 Nice Cedex 02 France - France

4 : INRA, UR875, MIAT (MIAT) - Site web

Institut national de la recherche agronomique (INRA) : UR875

F-31326 Castanet Tolosan - France

* : Auteur correspondant

Les forêts aléatoires (Breiman, 2001) sont une méthode d'apprentissage largement utilisée dans le cadre de problèmes de régression ou de classification en raison de leur flexibilité et de leurs bonnes performances de prédiction. Dans cette proposition de communication, nous présentons les résultats de simulations comparant les diverses approches permettant d'utiliser l'algorithme de forêts aléatoires dans le contexte de données massives.

Type :	:	oral
Thématiques	:	Big data
PDF version	:	PDF version

Autre

Personnes connectées : 1