Filter & Alphabet
Computer Vision

Image Classification

Bildklassifikation ist die Aufgabe, einem ganzen Bild ein Label zuzuordnen ('Das ist eine Katze'). Es ist die einfachste Form der Computer Vision. CNN...

Aufgabe

Detection

Detection (Objekterkennung) beantwortet die Frage 'Wo ist was im Bild?'. Es ist komplexer als Klassifikation, da es auch die Position (Bounding Box) b...

Konzept

Co-Pilot

Der Begriff 'Co-Pilot' (geprägt von GitHub Copilot und Microsoft) beschreibt die Philosophie, dass KI den Menschen nicht ersetzen, sondern als intell...

Optimierung

Stochastic Gradient Descent (SGD)

SGD ist die Standard-Variante des Gradientenabstiegs für große Datensätze. Statt den Fehler über *alle* Daten zu berechnen (zu langsam), berechnet...

Problem

Class Imbalance

Class Imbalance (Klassenungleichgewicht) ist ein häufiges Problem beim Training, wenn eine Klasse viel seltener vorkommt als andere (z.B. 99% gesunde...

Training

DPO (Direct Preference Optimization)

DPO ist eine neuere, effizientere Methode als RLHF, um Sprachmodelle an menschliche Präferenzen anzupassen. Statt ein komplexes separates Reward-Mode...

RL

Policy

Im Reinforcement Learning (RL) ist die Policy (Strategie oder Politik) das 'Gehirn' des Agenten. Sie ist eine Funktion oder ein Mapping, das definiert...

Training

Regularization

Regularisierung umfasst Techniken, die verhindern sollen, dass ein Modell 'overfittet' (auswendig lernt). Methoden wie L1/L2-Regularisierung (Weight D...

Training

Federated Learning

Federated Learning ist ein Ansatz des maschinellen Lernens, bei dem das Modell auf vielen dezentralen Geräten (z.B. Smartphones) trainiert wird, ohne...

Keine Begriffe gefunden.