Konzept

Turing Test

Der Turing-Test, 1950 von Alan Turing als 'Imitation Game' vorgeschlagen, ist ein philosophisches Gedankenexperiment zur Frage 'Können Maschinen denken?'. Ein menschlicher Fragesteller kommuniziert (per Text) mit zwei unbekannten Partnern: einem Menschen und einer Maschine. Wenn der Fragesteller nicht zuverlässig unterscheiden kann, wer die Maschine ist, hat sie den Test bestanden.

Lange Zeit galt dies als der ultimative Benchmark. Heute bestehen moderne LLMs (wie GPT-4) den Turing-Test trivialerweise oft, ohne dass wir ihnen Bewusstsein zuschreiben würden. Deshalb gilt der Test in der Forschung heute als veraltet und wird durch spezifische Benchmarks für Fähigkeiten ersetzt.

History