Binocular Disparity

Stereovision

Ponieważ nasze oczy są oddalone od siebie o 5-6 cm, obrazy wyświetlane na każdej siatkówce są nieco inne. Ta różnica w obrazach jest wskazówką dla głębi zwaną rozbieżnością obuoczną, która umożliwia doświadczenie głębi poprzez proces stereowizji. Proces ten łączy odpowiednie cechy w każdym obrazie siatkówki w jedną reprezentację, która zawiera informacje o odległości od widza.

Nie jesteśmy zwykle świadomi, że nasze oczy zawierają różne obrazy tej samej sceny, ale można to łatwo zademonstrować. Trzymaj palec wskazujący każdej ręki w pozycji pionowej bezpośrednio przed nosem, z jednym palcem w odległości około 20 cm (9 cali) i drugim palcem w odległości około 40 cm (18 cali). Teraz skup wzrok na bardziej oddalonym palcu i na zmianę zamykaj i otwieraj każde oko. Gdy to zrobisz, bliższy palec będzie wydawał się przeskakiwać z jednej strony dalszego palca na drugą. Jeśli teraz otworzysz oba oczy, powinieneś zobaczyć, że w rzeczywistości istnieją dwa obrazy bliższego palca. To jest właśnie rozbieżność obuoczna, która umożliwia dokładne postrzeganie głębi. Im większa odległość pozioma pomiędzy odpowiadającymi sobie obrazami tego samego obiektu w dwóch oczach (dwa obrazy bliższego palca w tej demonstracji), tym większa będzie jego postrzegana odległość od obiektu, który aktualnie znajduje się w centrum fovea w obu oczach (dalszy palec).

Położenia obiektu w dwóch obrazach siatkówki są systematycznie związane z odległością tego obiektu od obiektu, który aktualnie znajduje się w centrum dwóch obrazów w każdym oku. W porównaniu z promieniami światła, które wystają z fiksowanego obiektu do centrum każdej siatkówki, światło z obiektu, który jest bliżej widza spadnie nieco na prawo od centrum w lewym oku i na lewo od centrum w prawym oku (to jest nazywane disparity skrzyżowane). Światło z obiektu, który znajduje się dalej od fiksacji, będzie padać odwrotnie, lekko na lewo od środka w lewym oku i na prawo od środka w prawym oku (dysproporcja nieskrzyżowana). Dla każdego obiektu, który jest zafiksowany, istnieje wyimaginowany obszar przestrzeni otaczający widza w tej samej odległości, zwany obszarem Panuma. Obiekty znajdujące się w tej odległości nie wykazują rozbieżności obuocznej, co oznacza, że promienie świetlne padające na nie znajdują się w identycznej odległości od środka siatkówki w każdym oku. W związku z tym, obiekty te wydają się znajdować w tej samej odległości od widza, co obiekt aktualnie fiksowany. Obiekty znajdujące się poza tym obszarem wydają się być bliższe lub dalsze, w zależności od tego, czy w obu oczach wytwarzają skrzyżowane rozbieżności (dla obiektów bliższych) czy nieskrzyżowane rozbieżności (dla obiektów dalszych). Co więcej, wielkość rozbieżności odpowiada względnej odległości obiektu od obiektu fiksowanego. Proces stereowizji pozwala zatem mózgowi wnioskować o względnej odległości obiektów na podstawie zarówno znaku (skrzyżowane lub nieskrzyżowane), jak i wielkości (rozmiar) rozbieżności obrazu w dwóch oczach.

Stereowizja może być wykorzystywana do tworzenia iluzji trójwymiarowości, takich jak widziane w stereoskopach z epoki wiktoriańskiej, popularnej serii zabawek dla dzieci Viewmaster z XX wieku i okularach noszonych przez członków widowni na nowoczesnych filmach trójwymiarowych. Chociaż obrazy używane w takich urządzeniach zawsze zawierają wskazówki głębi inne niż rozbieżność obuoczna, takie jak okluzja, względna wielkość i cieniowanie (patrz rozdział o statycznych wskazówkach obrazowych), możliwe jest stworzenie przekonującej iluzji głębi przy użyciu jedynie zmian w rozbieżności, co oznacza, że stereowizja jest silniejszą wskazówką głębi niż inne wskazówki strukturalne. Bela Julesz opracował w Bell Laboratories w latach 60. ubiegłego wieku stereogramy z losowymi kropkami, by zademonstrować to zjawisko. Ostatnio, koncepcje wykorzystywane przy tworzeniu stereogramów z przypadkowymi kropkami zostały zastosowane do generowania fascynujących obrazów znanych jako autostereogramy lub obrazy Magic Eye™.

Jak sama nazwa wskazuje, stereogram z przypadkowymi kropkami wydaje się początkowo niczym innym jak grupą kropek w chaotycznym wzorze. Jednakże, niektóre z kropek zostały w rzeczywistości poziomo przesunięte względem siebie, tak że wertowanie oczu przed lub za głębią obrazu pozwala na uzyskanie iluzji głębi. Kiedy oczy są skupione na odpowiedniej odległości, obraz kropek w każdym oku jest mniej więcej taki sam, jednak niektóre z odpowiadających im kropek w każdym obrazie są przesunięte względem siebie. Ta lornetkowa rozbieżność generuje doświadczenie, że podzbiór wzoru kropek wyskoczył na pierwszy plan w stosunku do innych regionów wzoru kropek, które teraz wydają się być w tle.

Oprócz wykazania, że stereowizja może funkcjonować niezależnie od innych wskazówek dotyczących głębi, stereogramy z przypadkowymi kropkami wskazują również na złożoność mózgowych mechanizmów stereowizji. Dzieje się tak dlatego, że aby postrzegać głębię we wzorze przypadkowych kropek, mózg musi w jakiś sposób wiedzieć z góry, które kropki w jednym obrazie siatkówki odpowiadają tym samym kropkom w drugim obrazie siatkówki. Jest to znane jako problem korespondencji, i jak wiele problemów w ludzkim widzeniu, jest to paradoksalnie zarówno źle sformułowany problem, jak i taki, który mózg wydaje się rozwiązywać bez wysiłku. Fakt, że jest on źle sformułowany, oznacza, że przy braku jakiejkolwiek informacji innej niż ta zawarta we wzorach kropek, istnieje nieskończona liczba możliwych sposobów ułożenia dwóch dowolnych obrazów siatkówki. Fakt, że mózg rozwiązuje ten problem bez wysiłku, jest interpretowany jako oznaczający, że mózg musi używać apriorycznych założeń o regularnościach w środowisku, aby rozwiązać ten problem. Głównym wyzwaniem dla naukowców zajmujących się widzeniem jest ustalenie, jakie są te aprioryczne założenia. To, co jest już jasne, to fakt, że proces stereowizji dochodzi do wniosku szybciej i bardziej wiarygodnie, gdy jest informowany przez inne wskazówki głębokości, w tym monokularne wskazówki głębokości omówione w dalszej części tego wpisu.

Ludzkie niemowlęta nie wydają się posiadać funkcjonalnej stereowizji po urodzeniu, ale rozwija się ona dość szybko. Do czasu, gdy niemowlęta są w wieku 6 miesięcy, większość będzie wyświetlać stereowizję na zasadniczo dorosłych poziomach. Podobnie jak inne fizjologiczne wskazówki (akomodacja i wergencja), stereowizja jest efektywnie użyteczna tylko w odległości około 3 m od widza. Ponadto, z tych samych powodów, o których była mowa przy omawianiu wergencji (np. zez, amblyopia), od 5% do 10% populacji ogólnej nie ma użytecznej stereowizji z powodu braku równowagi w charakterze i jakości informacji zawartych w obu oczach.

.

Dodaj komentarz