Data Augmentation
Data Augmentation (Datenanreicherung) ist eine essenzielle Technik im Deep Learning, insbesondere in der Bildverarbeitung (Computer Vision), um die Menge und Varianz der Trainingsdaten künstlich zu erhöhen, ohne neue Daten sammeln zu müssen. Da neuronale Netze 'datenungrig' sind und Millionen von Beispielen benötigen, um robust zu generalisieren, reicht der ursprüngliche Datensatz oft nicht aus.
Bei Bildern werden durch Augmentation Kopien des Originalbildes erstellt und zufällig verändert: Sie werden leicht gedreht, gespiegelt, gezoomt, beschnitten oder in Helligkeit und Kontrast angepasst. Für das menschliche Auge bleibt es 'eine Katze', aber für den Computer sind die Pixelwerte völlig anders. Dies zwingt das Modell zu lernen, dass die Orientierung oder Beleuchtung irrelevant für das Objekt ist (Invarianz). Es verhindert effektiv Overfitting, da das Modell das Bild nie exakt gleich zweimal sieht.
Auch im NLP gibt es Augmentation (z.B. Rückübersetzung: Deutsch -> Englisch -> Deutsch), um Variationen in Sätzen zu erzeugen.