Stereovision
Da unsere Augen 5-6 cm voneinander entfernt sind, sind die Bilder, die auf jede Netzhaut projiziert werden, leicht unterschiedlich. Dieser Unterschied in den Bildern ist ein Hinweis auf die Tiefe, die so genannte binokulare Disparität, die die Wahrnehmung der Tiefe durch den Prozess der Stereovision ermöglicht. Bei diesem Prozess werden entsprechende Merkmale in jedem Netzhautbild zu einer einzigen Darstellung kombiniert, die auch Informationen über die Entfernung zum Betrachter enthält.
Normalerweise sind wir uns nicht bewusst, dass unsere Augen unterschiedliche Bilder derselben Szene enthalten, aber das lässt sich leicht demonstrieren. Halten Sie den Zeigefinger jeder Hand in aufrechter Position direkt vor Ihre Nase, wobei ein Finger etwa 20 cm und der andere etwa 40 cm entfernt ist. Richten Sie nun Ihre Augen auf den weiter entfernten Finger und schließen und öffnen Sie abwechselnd jedes Auge. Dabei scheint der nähere Finger von einer Seite des entfernteren Fingers zur anderen zu springen. Wenn Sie nun beide Augen gleichzeitig öffnen, sollten Sie sehen, dass es tatsächlich zwei Bilder des näheren Fingers gibt. Dies ist die binokulare Disparität, die eine genaue Wahrnehmung der Tiefe ermöglicht. Je größer der horizontale Abstand zwischen den entsprechenden Bildern desselben Objekts in den beiden Augen ist (in dieser Demonstration die beiden Bilder des näheren Fingers), desto größer ist seine wahrgenommene Entfernung von dem Objekt, das sich gerade im Zentrum der Fovea in beiden Augen befindet (der weiter entfernte Finger).
Die Positionen eines Objekts in den beiden Netzhautbildern sind systematisch mit der Entfernung dieses Objekts von dem Objekt verbunden, das sich gerade im Zentrum der beiden Bilder in jedem Auge befindet. Im Vergleich zu den Lichtstrahlen, die vom fixierten Objekt in die Mitte jeder Netzhaut projiziert werden, fällt das Licht eines Objekts, das dem Betrachter näher ist, im linken Auge leicht rechts von der Mitte und im rechten Auge leicht links von der Mitte (dies wird als gekreuzte Disparität bezeichnet). Licht von einem Objekt, das weiter vom fixierten Objekt entfernt ist, fällt im linken Auge leicht nach links von der Mitte und im rechten Auge nach rechts von der Mitte (ungekreuzte Disparität). Für jedes fixierte Objekt gibt es einen imaginären Bereich des Raums, der den Betrachter in derselben Entfernung umgibt, den so genannten Panum’schen Bereich. Objekte in dieser Entfernung haben keine binokulare Disparität, d. h. die von ihnen ausgehenden Lichtstrahlen fallen in beiden Augen in gleicher Entfernung vom Zentrum der Netzhaut. Diese Objekte scheinen also genauso weit vom Betrachter entfernt zu sein wie das gerade fixierte Objekt. Objekte außerhalb dieses Bereichs erscheinen näher oder weiter entfernt, je nachdem, ob sie in beiden Augen eine gekreuzte Disparität (für nähere Objekte) oder eine ungekreuzte Disparität (für weiter entfernte Objekte) erzeugen. Außerdem entspricht die Größe der Disparität der relativen Entfernung eines Objekts vom fixierten Objekt. Der Prozess der Stereovision ermöglicht es dem Gehirn also, die relative Entfernung von Objekten anhand des Vorzeichens (gekreuzt oder nicht gekreuzt) und der Größe der Bilddisparitäten in den beiden Augen zu bestimmen.
Stereovision kann genutzt werden, um Illusionen von Dreidimensionalität zu erzeugen, wie sie in den Stereoskopen der viktorianischen Ära, in der beliebten Viewmaster-Kinderspielzeugserie des 20. Jahrhunderts und in den Brillen, die die Zuschauer bei modernen dreidimensionalen Filmen tragen, zu sehen sind. Obwohl die Bilder, die in solchen Geräten verwendet werden, immer auch andere Tiefeninformationen als die binokulare Disparität enthalten, wie z. B. Okklusion, relative Größe und Schattierung (siehe Abschnitt über statische Bildinformationen), ist es möglich, eine überzeugende Illusion von Tiefe zu erzeugen, indem nur die Disparität verändert wird, was bedeutet, dass die Stereovision eine stärkere Tiefeninformation ist als die anderen strukturellen Informationen. Bela Julesz erfand in den 1960er Jahren in den Bell Laboratories Zufallspunkt-Stereogramme, um dies zu demonstrieren. In jüngerer Zeit wurden die Konzepte zur Erstellung von Zufalls-Punkt-Stereogrammen verwendet, um die faszinierenden Bilder zu erzeugen, die im Volksmund als Autostereogramme oder Magic Eye™-Bilder bekannt sind.
Wie der Name schon sagt, erscheint ein Zufalls-Punkt-Stereogramm zunächst nur als eine Gruppe von Punkten in einem chaotischen Muster. Einige der Punkte sind jedoch horizontal gegeneinander verschoben, so dass die Illusion von Tiefe entsteht, wenn man die Augen entweder vor oder hinter die Tiefe des Bildes richtet. Wenn die Augen auf die richtige Entfernung fokussiert sind, ist das Bild der Punkte in beiden Augen ungefähr gleich, aber einige der entsprechenden Punkte in jedem Bild sind relativ zueinander verschoben. Diese binokulare Disparität erzeugt die Erfahrung, dass ein Teil des Punktmusters im Vergleich zu anderen Regionen des Punktmusters, die nun im Hintergrund zu sein scheinen, in den Vordergrund gerückt ist.
Das Stereosehen zeigt nicht nur, dass es unabhängig von anderen Tiefenwahrnehmungen funktionieren kann, sondern weist auch auf die Komplexität der Stereosichtmechanismen im Gehirn hin. Denn um Tiefe im Muster zufälliger Punkte wahrnehmen zu können, muss das Gehirn irgendwie im Voraus wissen, welche Punkte in einem Netzhautbild denselben Punkten im anderen Netzhautbild entsprechen. Dies wird als Korrespondenzproblem bezeichnet, und wie bei vielen Problemen des menschlichen Sehens handelt es sich paradoxerweise sowohl um ein schlecht formuliertes Problem als auch um eines, das das Gehirn mühelos zu lösen scheint. Die Tatsache, dass das Problem unklar ist, bedeutet, dass es in Ermangelung anderer Informationen als der in den Punktmustern enthaltenen unendlich viele Möglichkeiten gibt, zwei beliebige Netzhautbilder aufeinander abzustimmen. Die Tatsache, dass das Gehirn das Problem mühelos löst, wird dahingehend interpretiert, dass das Gehirn a priori Annahmen über Regelmäßigkeiten in der Umgebung verwenden muss, um das Problem zu lösen. Eine große Herausforderung für die Sehforscher besteht darin, herauszufinden, was diese a priori Annahmen sind. Klar ist bereits, dass der Prozess der Stereovision schneller und zuverlässiger zu einem Ergebnis führt, wenn er durch andere Tiefeninformationen unterstützt wird, einschließlich der monokularen Tiefeninformationen, die weiter unten in diesem Beitrag behandelt werden.
Menschliche Säuglinge scheinen bei der Geburt noch nicht über eine funktionale Stereovision zu verfügen, aber sie entwickelt sich recht schnell. Bis zum Alter von 6 Monaten zeigen die meisten Säuglinge Stereovision auf dem Niveau von Erwachsenen. Wie die anderen physiologischen Signale (Akkommodation und Vergenz) ist das Stereosehen nur in einem Abstand von etwa 3 m vom Betrachter wirksam. Aus den gleichen Gründen wie bei der Vergenz (z. B. Schielen, Amblyopie) verfügen 5 bis 10 % der Bevölkerung nicht über eine brauchbare Stereovision, weil die Informationen der beiden Augen unausgewogen sind und in unterschiedlicher Qualität vorliegen.