Stereovision
Om våra ögon är 5-6 cm ifrån varandra är bilderna som projiceras på varje näthinna något olika. Denna skillnad i bilderna är en ledtråd till djup som kallas binokulär disparitet, vilket möjliggör upplevelsen av djup genom processen stereovision. Denna process kombinerar motsvarande egenskaper i varje näthinnebild till en enda representation som innehåller information om avståndet till betraktaren.
Vi är normalt inte medvetna om att våra ögon innehåller olika bilder av samma scen, men detta kan lätt demonstreras. Håll pekfingret på vardera handen i ett upprätt läge direkt framför näsan, med det ena fingret på cirka 20 cm avstånd och det andra fingret på cirka 40 cm avstånd. Fokusera nu ögonen på det mer avlägsna fingret och turas om att stänga och öppna varje öga. När du gör detta kommer det närmre fingret att tyckas hoppa från den ena sidan av det mer avlägsna fingret till den andra. Om du nu öppnar båda ögonen tillsammans bör du se att det faktiskt finns två bilder av det närmre fingret. Detta är binokulär disparitet, som möjliggör en korrekt uppfattning av djup. Ju större det horisontella avståndet är mellan motsvarande bilder av samma objekt i de två ögonen (de två bilderna av det närmare fingret i denna demonstration), desto större blir dess upplevda avstånd från det objekt som för närvarande befinner sig i centrum av fovean i båda ögonen (det längre bort liggande fingret).
Positionerna för ett objekt i de två näthinnebilderna är systematiskt relaterade till avståndet mellan det objektet och det objekt som för närvarande befinner sig i centrum av de två bilderna i varje öga. I jämförelse med de ljusstrålar som projiceras från det fixerade objektet till centrum av varje näthinna kommer ljus från ett objekt som är närmare betraktaren att falla något till höger om centrum i det vänstra ögat och till vänster om centrum i det högra ögat (detta kallas korsad disparitet). Ljus från ett objekt som befinner sig längre bort från det fixerade objektet kommer att göra det motsatta och falla något till vänster om centrum i det vänstra ögat och till höger om centrum i det högra ögat (okorsad disparitet). För varje objekt som är fixerat finns det en imaginär region i rummet som omger betraktaren på samma avstånd och som kallas Panums område. Objekt på detta avstånd har ingen binokulär disparitet, vilket innebär att de ljusstrålar som projiceras från dem faller på samma avstånd från näthinnans centrum i varje öga. Därför verkar dessa objekt också befinna sig på samma avstånd från betraktaren som det objekt som för närvarande är fixerat. Objekt utanför detta område kommer att verka närmare eller längre bort, beroende på om de ger upphov till korsad disparitet (för närmare objekt) eller okorsad disparitet (för längre bort liggande objekt) i de två ögonen. Storleken på dispariteten motsvarar dessutom ett objekts relativa avstånd från det fixerade objektet. Stereovisionsprocessen gör det därför möjligt för hjärnan att härleda objektens relativa avstånd på grundval av både tecknet (korsad eller okorsad) och storleken (storleken) på bildskillnaderna i de två ögonen.
Stereovision kan utnyttjas för att skapa illusioner av tredimensionalitet, såsom man kan se i stereoskop från den viktorianska eran, i den populära barnleksaksserien Viewmaster från 1900-talet och i glasögonen som åskådarna bär på moderna tredimensionella filmer. Även om de bilder som används i sådana apparater alltid innehåller andra djupindikationer än binokulär disparitet, t.ex. ocklusion, relativ storlek och skuggning (se avsnittet om statiska bildindikationer), är det möjligt att skapa en övertygande illusion av djup med hjälp av enbart förändringar i dispariteten, vilket innebär att stereovision är en kraftfullare djupindikation än de andra strukturella indikationerna. Bela Julesz uppfann stereogram med slumpmässiga punkter vid Bell Laboratories på 1960-talet för att visa detta. På senare tid har de koncept som används för att skapa stereogram med slumpmässiga punkter använts för att generera de fascinerande bilder som populärt kallas autostereogram eller Magic Eye™-bilder.
Som namnet antyder, ser ett stereogram med slumpmässiga punkter till en början ut som inget annat än en grupp punkter i ett kaotiskt mönster. En del av punkterna har dock i själva verket förskjutits horisontellt i förhållande till varandra, så att om ögonen placeras antingen framför eller bakom bildens djup kan en illusion av djup framträda. När ögonen är fokuserade på rätt avstånd är varje ögats bild av prickarna ungefär densamma, men några av de motsvarande prickarna i varje bild är förskjutna i förhållande till varandra. Denna binokulära disparitet genererar upplevelsen att en delmängd av punktmönstret har dykt upp i förgrunden i förhållande till andra områden av punktmönstret som nu verkar vara i bakgrunden.
Förutom att visa att stereovisionen kan fungera oberoende av andra djupindikationer, pekar stereogrammen med slumpmässiga punkter också på komplexiteten hos hjärnans stereovisionsmekanismer. Detta beror på att för att kunna uppfatta djup i mönstret av slumpmässiga punkter måste hjärnan på något sätt i förväg veta vilka punkter i den ena näthinnebilden som motsvarar samma punkter i den andra näthinnebilden. Detta är känt som korrespondensproblemet, och liksom många problem i människans syn är det paradoxalt nog både ett illa formulerat problem och ändå ett problem som hjärnan tycks lösa utan ansträngning. Det faktum att det är dåligt format innebär att i avsaknad av annan information än den som finns i punktmönstren, finns det ett oändligt antal möjliga sätt att anpassa två näthinnebilder till varandra. Det faktum att hjärnan löser problemet utan ansträngning tolkas som att hjärnan måste använda a priori antaganden om regelbundenheter i miljön för att lösa problemet. En stor utmaning för synforskare är att fastställa vilka dessa a priori antaganden är. Vad som redan står klart är att stereovisionsprocessen kommer till en slutsats snabbare och mer tillförlitligt när den informeras av andra djupindikationer, inklusive de monokulära indikationer på djup som granskas senare i detta inlägg.
Mänskliga spädbarn tycks inte ha en funktionell stereovision vid födseln, men den utvecklas ganska snabbt. När spädbarn är sex månader gamla uppvisar de flesta av dem stereovision på i huvudsak vuxennivå. I likhet med de andra fysiologiska signalerna (ackommodation och vergence) är stereovisionen endast effektivt användbar inom ett avstånd på cirka 3 meter från betraktaren. Av några av samma skäl som nämns i diskussionen om vergens (t.ex. vid strabism och amblyopi) har mellan 5 och 10 % av den allmänna befolkningen ingen användbar stereovision på grund av obalans i karaktären och kvaliteten på den information som finns i de två ögonen.