Campo de luz - Light field

El campo de luz es una función vectorial que describe la cantidad de luz que fluye en todas direcciones a través de cada punto del espacio. El espacio de todos los posibles rayos de luz está dado por la función plenóptica de cinco dimensiones , y la magnitud de cada rayo está dada por el resplandor . Michael Faraday fue el primero en proponer (en una conferencia de 1846 titulada "Pensamientos sobre las vibraciones de los rayos") que la luz debería interpretarse como un campo, muy parecido a los campos magnéticos en los que había estado trabajando durante varios años. La frase campo de luz fue acuñada por Andrey Gershun en un artículo clásico sobre las propiedades radiométricas de la luz en el espacio tridimensional (1936).

La función plenóptica 5D

El resplandor L a lo largo de un rayo se puede considerar como la cantidad de luz que viaja a lo largo de todas las posibles líneas rectas a través de un tubo cuyo tamaño está determinado por su ángulo sólido y su área de sección transversal.

Si el concepto se limita a la óptica geométrica , es decir, a la luz incoherente ya los objetos más grandes que la longitud de onda de la luz, entonces el portador fundamental de la luz es un rayo . La medida de la cantidad de luz que viaja a lo largo de un rayo es la radiación , denotada por L y medida en vatios (W) por estereorradián (sr) por metro cuadrado (m 2 ) . El estereorradián es una medida de ángulo sólido , y los metros cuadrados se utilizan aquí como una medida del área de la sección transversal, como se muestra a la derecha.

Parametrizar un rayo en el espacio 3D por posición ( x , y , z ) y dirección ( θ , ϕ ).

El resplandor a lo largo de todos esos rayos en una región del espacio tridimensional iluminado por una disposición inmutable de luces se denomina función plenóptica (Adelson 1991). La función de iluminación plenóptica es una función idealizada que se utiliza en la visión por computadora y los gráficos por computadora para expresar la imagen de una escena desde cualquier posición de visualización posible en cualquier ángulo de visualización en cualquier momento. En realidad, nunca se usa en la práctica de manera computacional, pero es conceptualmente útil para comprender otros conceptos de visión y gráficos (Wong 2002). Dado que los rayos en el espacio se pueden parametrizar mediante tres coordenadas, x , y , yz y dos ángulos θ y ϕ , como se muestra a la izquierda, es una función de cinco dimensiones, es decir, una función sobre una variedad de cinco dimensiones equivalente a el producto del espacio euclidiano 3D y la 2-esfera .

La suma de los vectores de irradiancia D 1 y D 2 que surgen de dos fuentes de luz I 1 e I 2 produce un vector resultante D que tiene la magnitud y la dirección que se muestran (Gershun, fig 17).

Al igual que Adelson, Gershun definió el campo de luz en cada punto del espacio como una función 5D. Sin embargo, lo trató como una colección infinita de vectores, uno por dirección que incide en el punto, con longitudes proporcionales a sus radiancias.

La integración de estos vectores sobre cualquier conjunto de luces, o sobre toda la esfera de direcciones, produce un único valor escalar: la irradiancia total en ese punto y una dirección resultante. La figura de la derecha, reproducida del artículo de Gershun, muestra este cálculo para el caso de dos fuentes de luz. En los gráficos por computadora, esta función del espacio 3D con valores vectoriales se denomina campo de irradiancia vectorial (Arvo, 1994). La dirección del vector en cada punto del campo se puede interpretar como la orientación que uno tendría frente a una superficie plana colocada en ese punto para iluminarla con mayor intensidad.

Mayor dimensionalidad

Se pueden considerar el tiempo, la longitud de onda y el ángulo de polarización como variables adicionales, lo que produce funciones de dimensiones superiores.

El campo de luz 4D

El resplandor a lo largo de un rayo permanece constante si no hay bloqueadores.

En una función plenóptica, si la región de interés contiene un objeto cóncavo (piense en una mano ahuecada), entonces la luz que deja un punto en el objeto puede viajar solo una corta distancia antes de ser bloqueada por otro punto en el objeto. Ningún dispositivo práctico podría medir la función en tal región.

Sin embargo, si nos limitamos a ubicaciones fuera del casco convexo (piense en una envoltura retráctil) del objeto, es decir, en el espacio libre, podemos medir la función plenóptica tomando muchas fotos con una cámara digital. Además, en este caso, la función contiene información redundante, porque la radiación a lo largo de un rayo permanece constante de un punto a otro a lo largo de su longitud, como se muestra a la izquierda. De hecho, la información redundante es exactamente una dimensión, dejándonos con una función de cuatro dimensiones (es decir, una función de puntos en una variedad de cuatro dimensiones particular ). Parry Moon denominó a esta función el campo fótico (1981), mientras que los investigadores en gráficos por computadora lo denominan campo de luz 4D (Levoy 1996) o Lumigraph (Gortler 1996). Formalmente, el campo de luz 4D se define como el resplandor a lo largo de los rayos en el espacio vacío.

El conjunto de rayos en un campo de luz se puede parametrizar de diversas formas, algunas de las cuales se muestran a continuación. De estos, el más común es la parametrización de dos planos que se muestra a la derecha (abajo). Si bien esta parametrización no puede representar todos los rayos, por ejemplo, rayos paralelos a los dos planos si los planos son paralelos entre sí, tiene la ventaja de relacionarse estrechamente con la geometría analítica de las imágenes en perspectiva. De hecho, una forma sencilla de pensar en un campo de luz de dos planos es como una colección de imágenes en perspectiva del plano st (y cualquier objeto que pueda estar a horcajadas o más allá de él), cada una tomada desde una posición de observador en el plano ultravioleta . Un campo de luz parametrizado de esta manera a veces se denomina placa de luz .

Algunas parametrizaciones alternativas del campo de luz 4D, que representa el flujo de luz a través de una región vacía del espacio tridimensional. Izquierda: puntos en un plano o superficie curva y direcciones que salen de cada punto. Centro: pares de puntos en la superficie de una esfera. Derecha: pares de puntos en dos planos en posición general (es decir, cualquiera).

Sonido analógico

El análogo del campo de luz 4D para el sonido es el campo de sonido o campo de onda, como en la síntesis de campo de onda , y la parametrización correspondiente es la integral de Kirchhoff-Helmholtz, que establece que, en ausencia de obstáculos, un campo de sonido a lo largo del tiempo es dado por la presión en un avión. Por lo tanto, se trata de dos dimensiones de información en cualquier momento y, a lo largo del tiempo, de un campo 3D.

Esta bidimensionalidad, en comparación con la aparente tetradimensionalidad de la luz, se debe a que la luz viaja en rayos (0D en un punto en el tiempo, 1D a lo largo del tiempo), mientras que según el principio de Huygens-Fresnel , un frente de onda de sonido se puede modelar como esférico. Ondas (2D en un punto en el tiempo, 3D a lo largo del tiempo): la luz se mueve en una sola dirección (2D de información), mientras que el sonido simplemente se expande en todas las direcciones. Sin embargo, la luz que viaja en medios no vacíos puede dispersarse de manera similar, y la irreversibilidad o la información perdida en la dispersión se percibe en la aparente pérdida de una dimensión del sistema.

Formas de crear campos de luz

Los campos de luz son una representación fundamental de la luz. Por tanto, existen tantas formas de crear campos de luz como programas informáticos capaces de crear imágenes o instrumentos capaces de captarlos.

En los gráficos por computadora, los campos de luz se producen típicamente ya sea renderizando un modelo 3D o fotografiando una escena real. En cualquier caso, para producir un campo de luz se deben obtener vistas para una gran colección de puntos de vista. Dependiendo de la parametrización empleada, esta colección típicamente abarcará alguna porción de una línea, círculo, plano, esfera u otra forma, aunque también son posibles colecciones no estructuradas de puntos de vista (Buehler 2001).

Los dispositivos para capturar campos de luz fotográficamente pueden incluir una cámara de mano en movimiento o una cámara controlada robóticamente (Levoy 2002), un arco de cámaras (como en el efecto de tiempo de bala usado en The Matrix ), una densa matriz de cámaras (Kanade 1998; Yang 2002 ; Wilburn 2005), cámaras portátiles ( Ng 2005; Georgiev 2006; Marwah 2013), microscopios (Levoy 2006) u otro sistema óptico (Bolles 1987).

¿Cuántas imágenes debería haber en un campo de luz? El campo de luz más grande conocido (de la estatua de la noche de Miguel Ángel ) contiene 24.000 imágenes de 1,3 megapíxeles. En un nivel más profundo, la respuesta depende de la aplicación. Para la representación de campo de luz (consulte la sección Aplicación a continuación), si desea caminar completamente alrededor de un objeto opaco, entonces, por supuesto, debe fotografiar su parte posterior. De manera menos obvia, si desea caminar cerca del objeto, y el objeto se encuentra a horcajadas en el plano st , entonces necesita imágenes tomadas en posiciones finamente espaciadas en el plano uv (en la parametrización de dos planos que se muestra arriba), que ahora está detrás usted, y estas imágenes deben tener una alta resolución espacial.

El número y la disposición de las imágenes en un campo de luz y la resolución de cada imagen se denominan en conjunto "muestreo" del campo de luz 4D. Numerosos investigadores han realizado análisis de muestreo de campo de luz ; un buen punto de partida es Chai (2000). También son de interés Durand (2005) para los efectos de oclusión, Ramamoorthi (2006) para los efectos de iluminación y reflexión, y Ng (2005) y Zwicker (2006) para aplicaciones a cámaras plenópticas y pantallas 3D, respectivamente.

Aplicaciones

Las imágenes computacionales se refieren a cualquier método de formación de imágenes que involucre una computadora digital. Muchos de estos métodos operan en longitudes de onda visibles y muchos de ellos producen campos de luz. Como resultado, enumerar todas las aplicaciones de los campos de luz requeriría estudiar todos los usos de la imagen computacional en el arte, la ciencia, la ingeniería y la medicina. En gráficos por computadora, algunas aplicaciones seleccionadas son:

Una fuente de luz orientada hacia abajo (F-F ') induce un campo de luz cuyos vectores de irradiancia se curvan hacia afuera. Usando cálculo, Gershun podría calcular la irradiancia que cae sobre puntos (P 1 , P 2 ) en una superficie. (Gershun, figura 24)
  • Ingeniería de iluminación: la razón de Gershun para estudiar el campo de luz fue derivar (en forma cerrada si es posible) los patrones de iluminación que se observarían en las superficies debido a las fuentes de luz de varias formas colocadas sobre estas superficies. A la derecha se muestra un ejemplo. Un estudio más moderno es (Ashdown 1993).
La rama de la óptica dedicada a la ingeniería de la iluminación es la óptica sin imágenes (Chaves 2015; Winston 2005). Utiliza ampliamente el concepto de líneas de flujo (líneas de flujo de Gershun) y flujo vectorial (vector de luz de Gershun). Sin embargo, el campo de luz (en este caso, las posiciones y direcciones que definen los rayos de luz) se describe comúnmente en términos de espacio de fase y óptica hamiltoniana .
  • Representación del campo de luz: extrayendo cortes 2D apropiados del campo de luz 4D de una escena, se pueden producir vistas novedosas de la escena (Levoy 1996; Gortler 1996). Dependiendo de la parametrización del campo de luz y los cortes, estas vistas pueden ser en perspectiva , ortográficas , de rendija cruzada (Zomet 2003), cámaras lineales generales (Yu y McMillan 2004), múltiples perspectivas (Rademacher 1998) u otro tipo de proyección. . El renderizado de campo de luz es una forma de renderizado basado en imágenes .
  • Fotografía de apertura sintética : al integrar un subconjunto 4D apropiado de las muestras en un campo de luz, se puede aproximar la vista que sería capturada por una cámara que tenga una apertura finita (es decir, sin orificios). Esta vista tiene una profundidad de campo finita. Al cortar o deformar el campo de luz antes de realizar esta integración, se puede enfocar en diferentes planos fronto-paralelos (Isaksen 2000) u oblicuos (Vaish 2005) en la escena. Si una cámara digital fuera capaz de capturar el campo de luz ( Ng 2005), sus fotografías permitirían reenfocarlas una vez tomadas.
  • Pantalla 3D: Al presentar un campo de luz utilizando tecnología que mapea cada muestra al rayo apropiado en el espacio físico, se obtiene un efecto visual autoestereoscópico similar a ver la escena original. Las tecnologías no digitales para hacer esto incluyen fotografía integral , panoramagramas de paralaje y holografía ; Las tecnologías digitales incluyen colocar una serie de lentes sobre una pantalla de alta resolución o proyectar las imágenes en una serie de lentes utilizando una serie de proyectores de video. Si este último se combina con una serie de cámaras de video, se puede capturar y mostrar un campo de luz que varía en el tiempo. Esto esencialmente constituye un sistema de televisión 3D (Javidi 2002; Matusik 2004).
  • Imágenes del cerebro: la actividad neuronal se puede registrar ópticamente mediante la codificación genética de neuronas con marcadores fluorescentes reversibles, por ejemplo, GCaMP que indican la presencia de iones de calcio en tiempo real. Dado que la microscopía de campo de luz captura información de volumen completo en un solo cuadro, es posible monitorear la actividad neuronal en muchas neuronas individuales distribuidas aleatoriamente en un gran volumen a la velocidad de cuadros de video (Grosenick, 2009, 2017; Perez, 2015). Incluso se puede realizar una medición cuantitativa de la actividad neuronal a pesar de las aberraciones ópticas en el tejido cerebral y sin reconstruir una imagen de volumen (Pegard, 2016), y se puede utilizar para monitorear la actividad en miles de neuronas en un mamífero que se comporta (Grosenick, 2017).
  • Reconstrucción de escena generalizada: La reconstrucción de escena generalizada (GSR) es un método de reconstrucción 3D a partir de múltiples imágenes donde el modelo de escena resultante representa un campo de luz generalizado y un campo de materia iluminable (Leffingwell, 2018). El campo de luz representa la luz que fluye en todas direcciones a través de cada punto de la escena. El campo de materia representa las propiedades de interacción de la luz de la materia que ocupa cada punto de la escena. GSR se puede realizar utilizando enfoques que incluyen campos de radiación neural (NeRF) (Mildenhall, 2020) y transporte de luz inverso (Leffingwell, 2018).

La generación de imágenes y la predistorsión de imágenes sintéticas para estereogramas holográficos es uno de los primeros ejemplos de campos de luz calculados, anticipando y luego motivando la geometría utilizada en el trabajo de Levoy y Hanrahan (Halle 1991, 1994).

Los enfoques modernos para la visualización del campo de luz exploran los codiseños de elementos ópticos y la computación compresiva para lograr resoluciones más altas, mayor contraste, campos de visión más amplios y otros beneficios (Wetzstein 2012, 2011; Lanman 2011, 2010).

  • Reducción del deslumbramiento: el deslumbramiento surge debido a la dispersión múltiple de la luz dentro del cuerpo de la cámara y la óptica de la lente y reduce el contraste de la imagen. Si bien el deslumbramiento se ha analizado en el espacio de imágenes 2D (Talvala 2007), es útil identificarlo como un fenómeno de espacio de rayos 4D (Raskar 2008). Al analizar estadísticamente el espacio de rayos dentro de una cámara, se pueden clasificar y eliminar los artefactos de deslumbramiento. En el espacio de rayos, el deslumbramiento se comporta como ruido de alta frecuencia y puede reducirse mediante el rechazo de valores atípicos. Dicho análisis se puede realizar capturando el campo de luz dentro de la cámara, pero da como resultado la pérdida de resolución espacial. El muestreo de rayos uniformes y no uniformes podría usarse para reducir el deslumbramiento sin comprometer significativamente la resolución de la imagen (Raskar 2008).

Ver también

Notas

Referencias

Teoría

Análisis

Cámaras de campo de luz

Pantallas de campo de luz

Archivos de campo de luz

Aplicaciones

volúmenes en el cerebro de los mamíferos "] bioRxiv 132688; doi: https://doi.org/10.1101/132688 .

  • Heide, F., Wetzstein, G., Raskar, R., Heidrich, W. (2013)

184026 / http://adaptiveimagesynthesis.com/ "Adaptive Image Synthesis for Compressive Displays"], ACM Transactions on Graphics (SIGGRAPH)