Accéder directement au contenu Accéder directement à la navigation
Pré-publication, Document de travail

Arbres CART et Forêts aléatoires, Importance et sélection de variables

Résumé : Deux des algorithmes proposés par Leo Breiman : les arbres CART (pour Classification And Regression Trees) introduits dans la première moitié des années 80 et les forêts aléatoires apparues, quant à elles, au début des années 2000, font l'objet de cet article. L'objectif est de proposer sur chacun des thèmes abordés, un exposé, une garantie théorique, un exemple et signaler variantes et extensions. Après un préambule, l'introduction rappelle les objectifs des problèmes de classification et de régression avant de retracer quelques prédécesseurs des forêts aléatoires. Ensuite, une section est consa-crée aux arbres CART puis les forêts aléatoires sont présentées. Ensuite, une procédure de sélection de variables basée sur la quantification de l'importance des variables est proposée. Enfin l'adaptation des forêts aléatoires au contexte du Big Data est esquissée.
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-01387654
Contributeur : Robin Genuer <>
Soumis le : lundi 16 janvier 2017 - 11:22:02
Dernière modification le : vendredi 27 mars 2020 - 02:40:34

Fichiers

genuer_poggi.chap_JES2016.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01387654, version 2
  • ARXIV : 1610.08203

Collections

Citation

Robin Genuer, Jean-Michel Poggi. Arbres CART et Forêts aléatoires, Importance et sélection de variables. 2017. ⟨hal-01387654v2⟩

Partager

Métriques

Consultations de la notice

1290

Téléchargements de fichiers

23156