Computer Vision

Bounding Box

Eine Bounding Box (Begrenzungsrahmen) ist das Standard-Output-Format für Objekterkennungs-Algorithmen (Object Detection) in der Computer Vision. Wenn eine KI ein Objekt auf einem Bild erkennt (z.B. ein Auto), dann markiert sie es nicht pixelgenau (das wäre Segmentierung), sondern zeichnet das kleinstmögliche Rechteck um das Objekt.

Eine Bounding Box wird meist durch vier Werte definiert: Die X- und Y-Koordinaten einer Ecke (meist oben links) sowie die Breite und Höhe des Rechtecks (oder die Koordinaten der gegenüberliegenden Ecke). Zusammen mit der Box liefert das Modell meist eine Klassenbezeichnung ('Auto') und einen Confidence Score ('98% sicher'). Bounding Boxes sind rechentechnisch sehr effizient und werden überall eingesetzt, von der Kennzeichenerkennung in Parkhäusern bis zum Tracking von Spielern bei Fußballübertragungen.

Object Detection