Stéréovision
Parce que nos yeux sont séparés de 5-6 cm, les images projetées sur chaque rétine sont légèrement différentes. Cette différence entre les images est un indice de profondeur appelé disparité binoculaire, qui permet l’expérience de la profondeur grâce au processus de stéréovision. Ce processus combine les caractéristiques correspondantes de chaque image rétinienne en une seule représentation qui comprend des informations sur la distance par rapport à l’observateur.
Nous ne sommes normalement pas conscients que nos yeux contiennent des images différentes de la même scène, mais cela peut être facilement démontré. Tenez l’index de chaque main en position verticale directement devant votre nez, avec un doigt à environ 20 cm (9 in) et l’autre à environ 40 cm (18 in). Concentrez-vous maintenant sur le doigt le plus éloigné et fermez et ouvrez chaque œil à tour de rôle. Pendant que vous faites cela, le doigt le plus proche semble sauter d’un côté du doigt le plus éloigné à l’autre. Si vous ouvrez maintenant les deux yeux ensemble, vous verrez qu’il y a en fait deux images du doigt le plus proche. C’est la disparité binoculaire, qui permet une perception précise de la profondeur. Plus la distance horizontale entre les images correspondantes du même objet dans les deux yeux (les deux images du doigt le plus proche dans cette démonstration) est grande, plus grande sera sa distance perçue par rapport à l’objet qui se trouve actuellement au centre de la fovéa dans les deux yeux (le doigt le plus éloigné).
Les positions d’un objet dans les deux images rétiniennes sont systématiquement liées à la distance de cet objet par rapport à l’objet qui se trouve actuellement au centre des deux images dans chaque œil. Par rapport aux rayons lumineux qui se projettent de l’objet fixé vers le centre de chaque rétine, la lumière provenant d’un objet plus proche de l’observateur tombera légèrement à droite du centre dans l’œil gauche, et à gauche du centre dans l’œil droit (on parle de disparité croisée). La lumière d’un objet plus éloigné de l’objet fixé fera l’inverse, en tombant légèrement à gauche du centre dans l’œil gauche et à droite du centre dans l’œil droit (disparité non croisée). Pour tout objet fixé, il existe une région imaginaire de l’espace entourant l’observateur à la même distance, appelée zone de Panum. Les objets situés à cette distance n’ont pas de disparité binoculaire, ce qui signifie que les rayons lumineux qu’ils projettent tombent à une distance identique du centre de la rétine de chaque œil. Par conséquent, ces objets semblent également se trouver à la même distance de l’observateur que l’objet actuellement fixé. Les objets situés en dehors de cette région paraîtront plus proches ou plus éloignés, selon qu’ils produisent une disparité croisée (pour les objets plus proches) ou une disparité non croisée (pour les objets plus éloignés) dans les deux yeux. En outre, la taille de la disparité correspond à la distance relative d’un objet par rapport à l’objet fixé. Le processus de stéréovision permet donc au cerveau de déduire la distance relative des objets sur la base à la fois du signe (croisé ou non croisé) et de l’ampleur (taille) des disparités d’image dans les deux yeux.
La stéréovision peut être exploitée pour créer des illusions de tridimensionnalité, comme on le voit dans les stéréoscopes de l’époque victorienne, dans la série populaire de jouets pour enfants Viewmaster du 20e siècle et dans les lunettes portées par les spectateurs des films tridimensionnels modernes. Bien que les images utilisées dans ces dispositifs comprennent toujours des indices de profondeur autres que la disparité binoculaire, tels que l’occlusion, la taille relative et l’ombrage (voir la section sur les indices d’images statiques), il est possible de créer une illusion de profondeur convaincante en utilisant uniquement les changements de disparité, ce qui signifie que la stéréovision est un indice de profondeur plus puissant que les autres indices structurels. Bela Julesz a inventé les stéréogrammes à points aléatoires aux Laboratoires Bell dans les années 1960 pour en faire la démonstration. Plus récemment, les concepts utilisés pour réaliser des stéréogrammes à points aléatoires ont été employés pour générer les images fascinantes connues populairement sous le nom d’autostéréogrammes ou d’images Magic Eye™.
Comme son nom l’indique, un stéréogramme à points aléatoires apparaît initialement comme rien d’autre qu’un groupe de points dans un motif chaotique. Cependant, certains des points ont en fait été déplacés horizontalement les uns par rapport aux autres, de sorte que le fait de verger les yeux devant ou derrière la profondeur de l’image permet de faire ressortir une illusion de profondeur. Lorsque les yeux sont focalisés à la bonne distance, l’image des points de chaque œil est à peu près la même, mais certains des points correspondants de chaque image sont déplacés les uns par rapport aux autres. Cette disparité binoculaire génère l’expérience qu’un sous-ensemble du motif de points a surgi au premier plan par rapport à d’autres régions du motif de points qui semblent maintenant être à l’arrière-plan.
En plus de démontrer que la stéréovision peut fonctionner indépendamment d’autres indices de profondeur, les stéréogrammes de points aléatoires soulignent également la complexité des mécanismes de stéréovision du cerveau. En effet, pour percevoir la profondeur dans le motif des points aléatoires, le cerveau doit d’une manière ou d’une autre savoir à l’avance quels points d’une image rétinienne correspondent aux mêmes points dans l’autre image rétinienne. C’est ce que l’on appelle le problème de la correspondance. Comme beaucoup de problèmes de la vision humaine, il s’agit paradoxalement d’un problème mal défini, que le cerveau semble pourtant résoudre sans effort. Le fait qu’il soit mal formé signifie qu’en l’absence de toute information autre que celle contenue dans les motifs des points, il existe un nombre infini de façons possibles d’aligner deux images rétiniennes. Le fait que le cerveau résout le problème sans effort est interprété comme signifiant que le cerveau doit utiliser des hypothèses a priori sur les régularités de l’environnement pour résoudre le problème. Un défi majeur pour les chercheurs en vision est de déterminer quelles sont ces hypothèses a priori. Ce qui est déjà clair, c’est que le processus de stéréovision arrive à une conclusion plus rapidement et de manière plus fiable lorsqu’il est informé par d’autres indices de profondeur, y compris les indices monoculaires de profondeur examinés plus loin dans cet article.
Les nourrissons humains ne semblent pas posséder une stéréovision fonctionnelle à la naissance, mais elle se développe assez rapidement. Au moment où les nourrissons ont 6 mois, la plupart d’entre eux afficheront une stéréovision à des niveaux essentiellement adultes. Comme les autres indices physiologiques (accommodation et vergence), la stéréovision n’est utile qu’à une distance d’environ 3 m de l’observateur. En outre, pour certaines des raisons mentionnées dans la discussion sur la vergence (par exemple, les conditions de strabisme, l’amblyopie), entre 5% et 10% de la population générale n’a pas de stéréovision utilisable en raison de déséquilibres dans la nature et la qualité des informations contenues dans les deux yeux.