Active Learning
Active Learning ist ein intelligentes Paradigma im maschinellen Lernen, das darauf abzielt, die Effizienz des Trainingsprozesses zu maximieren, indem es den Bedarf an manuell gelabelten Daten minimiert. In klassischen 'Supervised Learning'-Szenarien wird dem Algorithmus ein riesiger Datensatz vorgesetzt, der vollständig von Menschen beschriftet (annotiert) wurde. Dies ist oft teuer und zeitaufwendig. Active Learning dreht diesen Prozess um: Der Algorithmus analysiert die unbeschrifteten Daten und wählt selbstständig diejenigen aus, bei denen er am 'unsichersten' ist oder die er als am informativsten einschätzt.
Diese ausgewählten Beispiele werden dann einem menschlichen Experten ('Oracle') zur Beschriftung vorgelegt. Das Modell lernt aus diesen gezielten Beispielen, aktualisiert sein Wissen und wählt dann die nächste Charge an schwierigen Fällen aus. Durch diesen iterativen Zyklus kann man oft mit nur 10-20% der Datenmenge eine ähnliche Performance erreichen wie mit dem vollen Datensatz.
Active Learning ist besonders wertvoll in Domänen, in denen Expertenwissen teuer ist, wie in der medizinischen Bildgebung (wo ein Radiologe Bilder befunden muss) oder bei komplexen juristischen Dokumentenanalysen. Es kombiniert die Rechenkraft der Maschine (zum Durchsuchen großer Datenmengen) mit der kognitiven Präzision des Menschen.