Decision Tree
Ein Decision Tree (Entscheidungsbaum) ist einer der intuitivsten Algorithmen im maschinellen Lernen, der sowohl für Klassifikation als auch für Regression genutzt wird. Er modelliert Entscheidungen als baumartige Struktur. Man beginnt an der Wurzel mit einer Frage an ein Attribut der Daten (z.B. 'Ist das Einkommen > 50.000€?'). Je nach Antwort ('Ja' oder 'Nein') folgt man einem Pfad zu einem neuen Knoten mit einer weiteren Frage, bis man an einem 'Blatt' ankommt, das die finale Vorhersage enthält (z.B. 'Kreditwürdig').
Der große Vorteil ist die Transparenz ('White Box'): Man kann den Pfad exakt nachverfolgen und verstehen, warum eine Entscheidung getroffen wurde. Der Nachteil ist, dass einzelne Bäume oft instabil sind und zu Overfitting neigen. Daher werden sie in der Praxis meist zu Wäldern ('Random Forests') kombiniert, die viel robuster sind.