Accéder directement au contenu Accéder directement à la navigation
Pré-publication, Document de travail

Arbres CART et Forêts aléatoires, Importance et sélection de variables

Résumé : Deux des algorithmes proposés par Leo Breiman : les arbres CART (pour Classification And Regression Trees) introduits dans la première moitié des années 80 et les forêts aléatoires apparues, quant à elles, au début des années 2000, font l'objet de cet article. L'objectif est de proposer sur chacun des thèmes abordés, un exposé, une garantie théorique, un exemple et signaler variantes et extensions. Après un préambule, l'introduction rappelle les objectifs des problèmes de classification et de régression avant de retracer quelques prédécesseurs des forêts aléatoires. Ensuite, une section est consa-crée aux arbres CART puis les forêts aléatoires sont présentées. Ensuite, une procédure de sélection de variables basée sur la quantification de l'importance des variables est proposée. Enfin l'adaptation des forêts aléatoires au contexte du Big Data est esquissée.
Type de document :
Pré-publication, Document de travail
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-01387654
Contributeur : Robin Genuer <>
Soumis le : mardi 25 octobre 2016 - 22:21:27
Dernière modification le : mercredi 1 juillet 2020 - 10:12:03

Fichiers

genuer_poggi.chap_JES2016.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01387654, version 1
  • ARXIV : 1610.08203

Citation

Robin Genuer, Jean-Michel Poggi. Arbres CART et Forêts aléatoires, Importance et sélection de variables. 2016. ⟨hal-01387654v1⟩

Partager

Métriques

Consultations de la notice

127

Téléchargements de fichiers

1090