martes, 12 de febrero de 2008

Disparidad binocular y 3D

Escrito por: Brainy, Wis y Héctor.
El mundo que nos rodea lo percibimos en 3 dimensiones. Sin embargo, eso es algo que nuestro cerebro consigue a partir de una imagen del mundo en 2D que se proyecta sobre la retina. Es decir, que la luz entra por el ojo y llega a la retina, que es una superficie en 2D. ¿Cómo es capaz nuestro cerebro de conseguir la percepción en 3D a partir de una imagen en 2D? Hay varias claves que utiliza nuestro cerebro para conseguir dicho objetivo. En este post nos centraremos principalmente en una de esas claves: la disparidad binocular.
¿Qué es eso de la disparidad binocular? Según wikipedia: “se conoce como disparidad binocular o retinal a la ligera diferencia entre los dos puntos de vista proporcionados por ambos ojos.”
Es decir, que con un ojo no vemos exactamente lo mismo que con el otro, ya que se encuentran situados en lugares ligeramente diferentes en el rostro. Pero para entender mejor lo que es la disparidad, una pequeña prueba.

Haz la prueba
Pon tu dedo pulgar delante de tus ojos, con cosas detrás del mismo que sirvan como referencia. Enfoca con la vista tu dedo y cierra un ojo. Luego abre el ojo cerrado y cierra el otro. Hazlo varias veces seguidas. Da la impresión de que el dedo se mueve hacia los lados. Esto es debido a que la imagen que vemos con un ojo es ligeramente diferente a la que vemos con el otro.

La disparidad binocular puede ser cruzada o no cruzada. En disparidad cruzada, el objeto que vemos está situado más cerca que el punto de enfoque. Sin embargo, en la disparidad no cruzada, el objeto que vemos está más lejos que el punto de enfoque.

Haz la prueba
Ahora vamos a hacer algo parecido a lo que hemos hecho antes. Pero ahora utiliza 3 objetos, que sean similares a poder ser. Estos objetos van a hacer el papel que antes le ha correspondido al pulgar. Pueden valer fichas de dominó por ejemplo.
Coloca uno muy cerca de los ojos (con cierta distancia de seguridad), otro algo más lejos, y el tercero ya más lejano que los dos anteriores.
Es decir, en fila uno detrás de otro a diferentes distancias, frente a tu mirada. Mueve un poco el segundo a la derecha para que no quede justo detrás del primero, y haz lo mismo con el tercero, a una distancia un poco mayor. Así los tienes en fila y puedes verlos a los tres de un golpe de vista.
Ahora enfoca al segundo, al que está en el medio. Y enfocándolo, cierra un ojo. Luego ábrelo y cierra el otro. Y todo esto mientras enfocas el del medio (2º). ¿Qué ocurre? Si te fijas, el primer objeto y el tercero parecerán moverse igual que lo hacía el pulgar. Sin embargo, el tercero lo hará hacia un lado, y el primero al contrario.

Sí, vale, hay disparidad. Pero, ¿Qué tiene que ver esto con la percepción en 3D? Pues que nuestro cerebro usa la diferencia que hay entre ambos ojos para calcular mucho mejor la distancia a la que se encuentran los objetos. Es la única clave binocular de 3D. Todas las demás claves son monoculares. Sin embargo, ésta es una de las claves más importantes.

Haz la prueba
Pon tus dos dedos índices o dos objetos cualquiera (dos bolígrafos por ejemplo) uno detrás del otro a cierta distancia. Has de ponerlos de tal forma que queden en fila uno casi detrás del otro, pero que se vean ambos (como en el ejercicio anterior pero con sólo dos). Míralos fijamente y cierra un ojo. Vuelve a abrirlo. Vuelve a cerrarlo y a abrirlo otra vez. Y así todas las veces que quieras. ¿Notas cómo el hecho de ver con dos ojos da mucha más sensación de profundidad? ¿Notas que con dos ojos se aprecia mucho mejor la distancia que hay entre un objeto y otro?

Haz otra prueba
Pide a alguien que se ponga frente a ti, y mueva su dedo índice de atrás adelante (estando el dedo índice en vertical de modo que podríamos colocar un aro encima). Estando tú de frente, intenta tocar su dedo índice en movimiento desde un lateral con un bolígrafo con un ojo cerrado. Luego hazlo con los dos ojos abiertos. ¿Notas diferencia? ¿Notas que cuando usas los dos ojos eres mucho más preciso? Tener dos ojos ayuda a valorar mejor las distancias. Probablemente esto nos da una idea del valor evolutivo de la disparidad binocular para el ser humano.

Si nuestro cerebro usa la información de la disparidad para la percepción de 3D, ¿no podremos engañarle, presentando a cada ojo imágenes tal y como si estuviéramos viendo realmente objetos tridimensionales?

Sin usar nada más que esta clave de la disparidad, se pueden producir ilusiones 3D a partir de imágenes en 2D. De hecho así lo constató el psicólogo y neurocientífico Belá Julesz. Julesz mostró a través de los estereogramas, que se podía crear la ilusión de 3D solamente manipulando la clave de la disparidad binocular. Quien quiera ver algunos estereogramas puede hacerlo aquí. Imagino que todos recordaréis el famoso libro del “Ojo Mágico”. Pues ahora ya sabéis como funciona.
Pero Julesz no fue el primero en darse cuenta de que mediante la manipulación de la disparidad se podía producir el efecto de 3D. Quien lo hizo fue el físico Charles Wheatstone, que fue el que inventó el estereoscopio. En la foto podemos ver cómo hay dos imágenes sacadas con una cámara con dos lentes separadas a la distancia a la que se encontrarían los ojos humanos. Con el aparato se acerca una imagen a cada ojo. Así se crea la ilusión de 3D.


Existen otros sistemas de crear la sensación de 3D, como pueden ser los anaglifos, creados por primera vez por el fotógrafo francés Louis Ducos du Hauron. Este sistema necesita de unas gafas como las que aparecen en la foto.


Las gafas correspondientes son las azules y rojas. Las lentes son filtros que solamente dejan pasar una de las dos imágenes que estarán dibujadas o fotografiadas…o proyectadas, ya que creo que este sistema se ha usado también para proyectar películas.
Al final se basa en lo mismo que los anteriores, en dos imágenes tomadas (como las que percibiríamos de forma natural por cada ojo con un objeto 3D), y mediante las gafas conseguir que sólo una de esas dos imágenes llegue a cada ojo, imitando así lo que percibiríamos si hubiera realmente un objeto en 3D. Sólo que no lo hay, es una ilusión creada a partir de una imagen en 2D. Quien quiera fabricarse unas gafas puede encontrar cómo hacerlo aquí.
Y quien quiera usarlas luego, podrá encontrar imágenes bastante conseguidas aquí y aquí.

Por último comentar también los sistemas que se valen de la polarización para conseguir generar la ilusión de 3D. En los cines 3D es el sistema que se usa.
Pero, ¿qué es la polarización? ¿Qué son las lentes polarizadas?

Polarización
Antes de nada habrá que saber qué es la polarización, así que intentaré explicarlo de la manera más sencilla posible. La luz se trata de una onda electromagnética que se propaga en todas las direcciones, por eso cuando encendemos una lámpara se ilumina toda la habitación y no solo el suelo que tiene debajo. El decir que es una onda electromagnética significa que tiene una componente de campo eléctrico y otra de campo magnético. Estos dos campos llevan direcciones perpendiculares y el uno depende del otro de modo que para nuestra explicación servirá con hablar únicamente de uno de ellos, por ejemplo el eléctrico.
Pues bien, el campo eléctrico de la luz mientras se propaga por el espacio va continuamente girando en todos los planos. Esto es como si cogéis un folio y lo empezáis a girar continuamente por su eje central. El campo eléctrico de la luz hace eso mismo. Pero, ¿qué ocurre si conseguimos que la luz únicamente vaya en un plano? La respuesta es muy sencilla. Y es que una vez conseguido esto, decimos que la luz está polarizada. Quizá sea un poco lioso explicarlo de palabra, pero se ve fácilmente con un dibujo.


El conseguir la polarización de la luz no es un trabajo complicado aunque parezca difícil. Lo que se debe hacer es disponer de una lámina con unas ranuras de una altura determinada y en una posición determinada. Para la luz, por ejemplo, la altura de estas aberturas debe ser del orden de la longitud de onda de la luz, es decir entre 380 y 780 nanómetros, dependiendo del color que queramos obtener. Para una onda electromagnética de mayor longitud de onda como por ejemplo las microondas, las ranuras deben ser de entre un milímetro y un metro.
Lo de la posición tiene que ver con la absorción del campo eléctrico que tiene lugar en las ranuras, pero sería bastante complicado de explicar, de modo que os diré lo que podéis hacer para comprobarlo experimentalmente. Cuando vais al cine IMAX en 3D, las gafas están diseñadas para polarizar la luz en el sentido correcto para obtener la ilusión en 3D. Pero, ¿que ocurre si giramos nuestra cabeza acercándola a uno de nuestros hombros? Pues que estaremos cambiando en 90 grados el ángulo de las microscópicas ranuras de las gafas, por lo que la polarización no se produce y veréis la película igual que si no las tuvierais puestas. Si sois muy impacientes y queréis ver este efecto antes de que empiece la película también podéis usar vuestro teléfono móvil. La luz que sale de él está polarizada ya que las pantallas de cristal líquido o LCD funcionan de este modo. Así que si giráis el móvil enfrente de vosotros, notaréis variaciones en el brillo de la pantalla, e incluso puede llegar a verse completamente oscura. De ahí que sea imprescindible disponer de las ranuras en la posición adecuada.
Si queréis hacer vuestras propias pruebas en internet, tenéis esta página en la que podréis elegir el ángulo con el que veis la luz polarizada. Considerad lo que llaman analizador como si fuera vuestra vista. Espero que gracias a esta página podáis entender mejor todo este tema de la polarización de la luz.

Aquí tenéis unas gafas para producir la polarización:


¿Cómo se consigue la ilusión 3D con lentes polarizadas?
Al final volvemos a lo mismo. Se proyectan dos películas superpuestas una para cada ojo, y eso provoca la sensación de 3D. Las lentes polarizadas sirven para que por un ojo sólo se vea una de las proyecciones, y por el otro la otra. Es decir, que se proyectan dos películas ambas con luz polarizada, pero en distintos planos. Así mediante las gafas, cada proyección sólo se ve por el ojo adecuado. Si por ejemplo una de las dos proyecciones cae, el lado correspondiente quedará en negro, ya que no pasará nada de luz. La luz de la proyección destinada al otro ojo no pasa, ya que la gafa sólo deja pasar por ese lado la luz que se propague en un determinado plano.

Haz la prueba
Vete a una sala de cine 3D que tenga el sistema IMAX 3D. Durante la película quítate las gafas, y verás que sin las lentes polarizadas ves una película doble. Cuando te pones las gafas lo ves todo en 3D, porque cada lente selecciona una película para cada ojo.
Otra cosa que puedes hacer es cerrar un ojo. Si cierras un ojo, desaparecerá la ilusión de 3D, ya que se basa precisamente en la disparidad BINOCULAR. Eso quiere decir que se necesitan 2 ojos para percibir el efecto. Y esto es válido para el IMAX y para todos los sistemas anteriores. Si cerramos un ojo el efecto se va.

Fíjate
Pon un dedo frente a tus ojos y enfoca un objeto que esté más lejos que el dedo. Si nos fijamos, si un objeto está muy cerca de nosotros, existe mucha disparidad (si enfocamos un objeto más lejano). Si tengo el dedo muy cerca de los ojos y hago lo de cerrar un ojo y luego abrirlo y cerrar el otro, la imagen del dedo cercano parece moverse mucho. Si lo alejo un poco la disparidad es menor, y al hacer lo de cerrar un ojo y luego el otro, parece moverse menos.
Fíjate en el cine. Si te quitas las gafas verás que los objetos que se supone están muy cerca de ti en la ilusión de 3D (que casi parece puedes tocarlos), al quitarse uno las gafas son los que más distancia tienen con su copia (con los mismos objetos en la otra proyección superpuesta). Los objetos que están algo más alejados, tienen una separación menor.
Podrás también ver cómo cuando en la ilusión 3D acercan un objeto (como las letras del final que a veces las presentan así), el objeto al ser visto sin las gafas polarizadas lo que hace es separarse de su copia (que realmente no es una copia, sino una imagen muy similar vista desde un punto de vista ligeramente diferente: el de nuestro otro ojo).

Saliéndonos de la disparidad: constancia del tamaño
Los objetos más cercanos ocupan un mayor espacio en la retina. Los más lejanos ocupan un espacio menor. Es lo que se llama constancia del tamaño en función de la distancia. Y es que la distancia percibida a la que están los objetos no es una dimensión independiente a la del tamaño percibido, sino que están en relación. Así si por ejemplo manipulamos las claves de la distancia percibida, el tamaño varía y se producen ilusiones de tamaño. Lo vimos aquí y aquí hace algún tiempo.

Haz la prueba
Cuando vayas al cine fíjate bien. Cuando algo se acerca mucho en la ilusión de 3D, si uno se quita las gafas, lo que ve es que se separan las imágenes y aumentan su tamaño.
Es decir, que aumenta la separación de las imágenes de las dos películas (del objeto que se acerca) y aumentan su tamaño. Por ejemplo, se acerca un tiburón a comernos. Pues la imagen del mismo en las dos proyecciones se separa más y más, según percibimos que se acerca en la ilusión. Y su tamaño aumenta para mantener la constancia de tamaño.

Disfrutad probando por vosotros mismos :)

Bases cerebrales de la visión en 3D
Como hemos comentado antes, cuando un objeto aparece en el campo visual los movimientos oculares se encargan de dirigir la mirada hacia ese objeto para realizar la fijación visual. En el momento en que el blanco se proyecta en medio de ambas fóveas se percibe una imagen única (fusión binocular), y finaliza el movimiento ocular. Esto sirve para coordinar ambos ojos, ya que el campo visual de cada uno de ellos es diferente, como habréis podido comprobar si habéis realizado alguna de las pruebas que os hemos propuesto.
La disparidad retiniana es empleada por el cerebro de dos modos diferentes: primero, como una retroalimentación para que el sistema oculomotor realice el alineamiento ocular y estabilice la imagen en la retina y segundo, como información para alcanzar la estereopsis o visión en 3D. Para que el cerebro utilice las disparidades debe establecerse de alguna manera la correspondencia entre las características de la imagen que caen en cada retina, pero todavía no se sabe cómo el cerebro resuelve este problema de correspondencia.
Así pues, las disparidades retinianas están siempre presentes durante la visión binocular normal, por lo que el sistema debe utilizarlas para alcanzar la visión única. Desde los trabajos de Gian F.Poggio se conoce la existencia de células en la corteza cerebral visual sensibles a disparidades retinianas horizontales. Los primeros procesos de información estereoscópica dependen de tres sistemas funcionales principales de neuronas corticales: el sistema de disparidad cercano (formado por neuronas que responden a disparidades cruzadas), el sistema de disparidad lejano (formado por neuronas que responden a disparidades no cruzadas) y el sistema correspondiente o de disparidad cero (formado por neuronas que responden no a la disparidad sino a la correlación de texturas, lo que ayuda también a formar la imagen en 3D) . Estos tres sistemas se han identificado en las áreas V1, V2 y V3 de la corteza visual de los macacos. A nivel funcional, las poblaciones de neuronas de los sistemas de cercanía y lejanía dan lugar al procesamiento neural que da lugar a la estereopsis grosera y algunos subtipos entre ellas contribuirían a la estereopsis fina.. Las neuronas del sistema de disparidad cero contribuyen a los mecanismos de retroalimentación del sistema oculomotor.
En la percepción de profundidad también influyen mecanismos monoculares como la percepción de contornos, a lo que contribuye de forma decisiva la percepción de sombras, y la información procedente de la perspectiva (lineal, tamaño, escorzo, detalle, etc). Existen células sensibles exclusivamente a cada una de estas características en la corteza visual. El tamaño de los objetos también será importante a la hora de que el cerebro genere la percepción de profundidad y, por último, el paralaje monocular también es otro factor importante para la percepción de profundidad

Pero existen neuronas en otras áreas de la corteza no visual que también parecen participar en la visión en 3D. Los mecanismos neurales de la visión estereoscópica de la forma han sido estudiados desde hace relativamente poco y en estos procesos han sido involucradas dos áreas cerebrales estudiadas en los macacos: una pequeña subregión del córtex inferotemporal llamada TEs (ver Figura a) y la región intraparietal caudal (CIP) (ver en este enlace, marcada en rojo, y obsérvese lo similar del cerebro del macaco al del humano). De hecho, a nivel clínico se ha observado que sujetos con lesiones en el lóbulo temporal pueden tener problemas para visualizar objetos en 3D o pueden incluso llegar a perder esa capacidad.
Las neuronas de TEs responden selectivamente a la orientación y curvatura en la superficie de imágenes estereoscópicas, por lo que esta región da lugar a una descripción detallada en 3D de los contornos de la superficie y de su contenido. Esta descripción es producida sólo por estímulos binoculares en los cuales los sujetos ven la profundidad y ésta no varía aunque se modifique dicha profundidad.


Las neuronas de la región CIP son sensibles a la orientación en profundidad de superficies y objetos alargados y sus respuestas no se ven modificadas por pistas de profundidad. Estas neuronas responden también a gradientes de textura y perspectiva lineal y sus respuestas se incrementan cuando estos elementos se combinan de formas determinadas. También en CIP hay neuronas sensibles a la orientación de ejes. Algunos datos preliminares muestran que algunas de las neuronas sensibles a la orientación de los ejes prefieren un grosor intermedio, son selectivas de forma y no parecen discriminar la curvatura de la superficie.
Estos datos sugieren que las neuronas encargadas de representar la forma en 3D estarían situadas en torno a las áreas Tes y CIP y reciben proyecciones de áreas corticales visuales como V3 y V4 (áreas de procesamiento visual), pero todavía no se conoce el proceso con detalle (ver Figura b).. De hecho, es uno de los aspectos menos estudiados de la visión.


Bibliografía.

Orban, G.A., Janssen, P., Vogels, R., (2006), Extracting 3D structure from disparity, TRENDS in Neurosciences.29 (8):466-473.

Sakata,H., Tsutsui,K., Taira, M., (2005), Toward an understanding of the neural processing for 3D shape perception, Neuropsychologia 43: 151–161

Acuña,C., Cudeiro, J., “Procesos visuales centrales”, (1998) En: Manual de neurociencia, Delgado, J.M., Ferrús, A., Mora, F., Rubia, F.J. Ed.Síntesis págs:579-614.

¿Funciona la astrología?
¿Qué esconde la serie "Héroes"?

4 comentarios:

Wis_Alien dijo...

Menuda pezado entrada, eh?? :P :P

Por cierto, Brainy es del blog "El cerebro de Darwin", no??

Héctor dijo...

Sí, Brainy colabora en "El cerebro de Darwin".
La verdad es que sí que ha quedado una entrada hermosa, jeje :P

Wis_Alien dijo...

Ya subí la entrada en mi blog también. Te prguntaba lo de Brainy porque puse un enlace en tu nombre y en el de él hacia vuestros blogs. ;)

Saludos

Héctor dijo...

Ok, los enlaces siempre están bien :)
Sí, ya te he visto mientras subías las fotos. Ahora le echo un vistazo y de paso comento algo ;)