blob: 496856de5764ce06011db5767dd5e036dde6e98f (
plain)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
|
# Decision trees
Grande explicabilité
## Construction (CART)
- Recherche pour chaque noeud d'une feature et d'un seuil qui sépare le dataset
- Minimisation d'une fonction de coût basée sur l'impureté de Gini
- `max_depth` pour la profondeur max de l'arbre
- Autres hyperparamètres : nb_feuilles, taille du split...
Arrêt sur un résultat raisonnable car complexité
Peu de différence entre **entropie** et **impureté de Gini**
## Régularisation
Overfitting probable
## Régression
prédiction de valeur != classe
minimisation de la MSE au moment de split
# Limites des arbres de décision
- peu adoptés
- attention normalisation
- Variance élevée (sensibilité aux hyperparamètres)
|