Coordenadas homogéneas - Homogeneous coordinates

Curva racional de Bézier - curva polinomial definida en coordenadas homogéneas (azul) y su proyección en el plano - curva racional (rojo)

En matemáticas , las coordenadas homogéneas o proyectivas , introducidas por August Ferdinand Möbius en su obra de 1827 Der barycentrische Calcul , son un sistema de coordenadas utilizado en geometría proyectiva , como las coordenadas cartesianas se utilizan en geometría euclidiana . Tienen la ventaja de que las coordenadas de los puntos, incluidos los puntos en el infinito, se pueden representar mediante coordenadas finitas. Las fórmulas que involucran coordenadas homogéneas son a menudo más simples y simétricas que sus contrapartes cartesianas. Las coordenadas homogéneas tienen una gama de aplicaciones, incluida la infografía y la visión 3D por computadora , donde permiten que las transformaciones afines y, en general, las transformaciones proyectivas sean fácilmente representadas por una matriz.

Si las coordenadas homogéneas de un punto se multiplican por un escalar distinto de cero, las coordenadas resultantes representan el mismo punto. Dado que también se dan coordenadas homogéneas a puntos en el infinito , el número de coordenadas necesarias para permitir esta extensión es uno más que la dimensión del espacio proyectivo que se está considerando. Por ejemplo, se requieren dos coordenadas homogéneas para especificar un punto en la línea proyectiva y se requieren tres coordenadas homogéneas para especificar un punto en el plano proyectivo.

Introducción

El plano proyectivo real puede considerarse como el plano euclidiano con puntos adicionales agregados, que se denominan puntos en el infinito , y se considera que se encuentran en una nueva línea, la línea en el infinito . Hay un punto en el infinito correspondiente a cada dirección (dado numéricamente por la pendiente de una línea), informalmente definido como el límite de un punto que se mueve en esa dirección alejándose del origen. Se dice que las líneas paralelas en el plano euclidiano se intersecan en un punto en el infinito correspondiente a su dirección común. Dado un punto ( x , y ) en el plano euclidiano, para cualquier número real Z distinto de cero , el triple ( xZ , yZ , Z ) se denomina conjunto de coordenadas homogéneas para el punto. Según esta definición, multiplicar las tres coordenadas homogéneas por un factor común distinto de cero da un nuevo conjunto de coordenadas homogéneas para el mismo punto. En particular, ( x , y , 1) es un sistema de coordenadas homogéneas para el punto ( x , y ) . Por ejemplo, el punto cartesiano (1, 2) se puede representar en coordenadas homogéneas como (1, 2, 1) o (2, 4, 2) . Las coordenadas cartesianas originales se recuperan dividiendo las dos primeras posiciones por la tercera. Por tanto, a diferencia de las coordenadas cartesianas, un solo punto puede representarse mediante infinitas coordenadas homogéneas.

La ecuación de una recta a través del origen (0, 0) puede ser escrita nx + mi = 0 , donde n y m no son ambos 0. En paramétrico forma esto puede escribirse x = mt , y = - nt . Sea Z = 1 / t , por lo que las coordenadas de un punto en la línea se pueden escribir ( m / Z , - n / Z ) . En coordenadas homogéneas esto se convierte en ( m , - n , Z ) . En el límite, cuando t se acerca al infinito, es decir, cuando el punto se aleja del origen, Z se acerca a 0 y las coordenadas homogéneas del punto se vuelven ( m , - n , 0) . Por lo tanto, definimos ( m , - n , 0) como las coordenadas homogéneas del punto en el infinito correspondiente a la dirección de la línea nx + my = 0 . Como cualquier línea del plano euclidiano es paralela a una línea que pasa por el origen, y dado que las líneas paralelas tienen el mismo punto en el infinito, al punto infinito en cada línea del plano euclidiano se le han dado coordenadas homogéneas.

Para resumir:

  • Cualquier punto en el plano proyectivo está representado por un triple ( X , Y , Z ) , llamado coordenadas homogéneas o coordenadas proyectivas del punto, donde X , Y y Z no son todos 0.
  • El punto representado por un conjunto dado de coordenadas homogéneas no cambia si las coordenadas se multiplican por un factor común.
  • A la inversa, dos conjuntos de coordenadas homogéneas representan el mismo punto si y solo si uno se obtiene del otro multiplicando todas las coordenadas por la misma constante distinta de cero.
  • Cuando Z no es 0, el punto representado es el punto ( X / Z , Y / Z ) en el plano euclidiano.
  • Cuando Z es 0, el punto representado es un punto en el infinito.

El triple (0, 0, 0) se omite y no representa ningún punto. El origen del plano euclidiano está representado por (0, 0, 1) .

Notación

Algunos autores utilizan notaciones diferentes para coordenadas homogéneas que ayudan a distinguirlas de las coordenadas cartesianas. El uso de dos puntos en lugar de comas, por ejemplo ( x : y : z ) en lugar de ( x , y , z ) , enfatiza que las coordenadas deben considerarse proporciones. Los corchetes, como en [ x , y , z ] enfatizan que múltiples conjuntos de coordenadas están asociados con un solo punto. Algunos autores utilizan una combinación de dos puntos y corchetes, como en [ x : y : z ].

Otras dimensiones

La discusión en la sección anterior se aplica de manera análoga a los espacios proyectivos distintos del plano. Entonces, los puntos en la línea proyectiva pueden estar representados por pares de coordenadas ( x , y ) , no ambos por cero. En este caso, el punto en el infinito es (1, 0) . De manera similar, los puntos en el espacio n proyectivo están representados por ( n  + 1) -tuplas.

Otros espacios proyectivos

El uso de números reales da coordenadas homogéneas de puntos en el caso clásico de los espacios proyectivos reales, sin embargo, se puede usar cualquier campo , en particular, los números complejos se pueden usar para el espacio proyectivo complejo . Por ejemplo, la línea proyectiva compleja utiliza dos coordenadas complejas homogéneas y se conoce como la esfera de Riemann . Se pueden utilizar otros campos, incluidos los campos finitos .

También se pueden crear coordenadas homogéneas para espacios proyectivos con elementos de un anillo de división (un campo sesgado). Sin embargo, en este caso, debe tenerse en cuenta el hecho de que la multiplicación no puede ser conmutativa .

Para el anillo general A , se puede definir una línea proyectiva sobre A con factores homogéneos que actúan a la izquierda y el grupo lineal proyectivo que actúa a la derecha.

Definición alternativa

Se puede dar otra definición del plano proyectivo real en términos de clases de equivalencia . Para elementos distintos de cero de R 3 , defina ( x 1 , y 1 , z 1 ) ~ ( x 2 , y 2 , z 2 ) para significar que hay una λ distinta de cero de modo que ( x 1 , y 1 , z 1 ) = ( λx 2 , λy 2 , λz 2 ) . Entonces ~ es una relación de equivalencia y el plano proyectivo se puede definir como las clases de equivalencia de R 3 ∖ {0}. Si ( x , y , z ) es uno de los elementos de la clase de equivalencia p, entonces se toman como coordenadas homogéneas de p .

Las líneas en este espacio se definen como conjuntos de soluciones de ecuaciones de la forma ax + by + cz = 0 donde no todos los de a , b y c son cero. La satisfacción de la condición ax + by + cz = 0 depende solo de la clase de equivalencia de ( x , y , z ), por lo que la ecuación define un conjunto de puntos en el plano proyectivo. El mapeo ( x , y ) → ( x , y , 1) define una inclusión del plano euclidiano al plano proyectivo y el complemento de la imagen es el conjunto de puntos con z = 0 . La ecuación z = 0 es una ecuación de una línea en el plano proyectivo ( ver definición de una línea en el plano proyectivo ), y se llama línea en el infinito .

Las clases de equivalencia, p , son las líneas que pasan por el origen con el origen eliminado. El origen no juega realmente un papel esencial en la discusión anterior, por lo que puede volver a agregarse sin cambiar las propiedades del plano proyectivo. Esto produce una variación en la definición, es decir, el plano proyectivo se define como el conjunto de líneas en R 3 que pasan por el origen y las coordenadas de un elemento distinto de cero ( x , y , z ) de una línea se toman como coordenadas homogéneas de la línea. Estas líneas ahora se interpretan como puntos en el plano proyectivo.

Nuevamente, esta discusión se aplica de manera análoga a otras dimensiones. Entonces, el espacio proyectivo de dimensión n se puede definir como el conjunto de líneas que pasan por el origen en R n +1 .

Homogeneidad

Las coordenadas homogéneas no están determinadas únicamente por un punto, por lo que una función definida en las coordenadas, digamos f ( x , y , z ) , no determina una función definida en puntos como con las coordenadas cartesianas. Pero una condición f ( x , y , z ) = 0 definida en las coordenadas, como podría usarse para describir una curva, determina una condición en los puntos si la función es homogénea . Específicamente, suponga que existe una k tal que

Si un conjunto de coordenadas representa el mismo punto que ( x , y , z ), entonces se puede escribir x , λ y , λ z ) para algún valor de λ distinto de cero. Luego

Un polinomio g ( x , y ) de grado k se puede convertir en un polinomio homogéneo reemplazando x con x / z , y con y / z y multiplicando por z k , en otras palabras definiendo

La función resultante f es un polinomio, por lo que tiene sentido extender su dominio a triples donde z = 0 . El proceso se puede revertir estableciendo z = 1 , o

La ecuación f ( x , y , z ) = 0 se puede pensar entonces como la forma homogénea de g ( x , y ) = 0 y define la misma curva cuando se restringe al plano euclidiano. Por ejemplo, la forma homogénea de la ecuación de la recta ax + by + c = 0 es ax + by + cz = 0.

Coordenadas de línea y dualidad

La ecuación de una línea en el plano proyectivo se puede dar como sx + ty + uz = 0 donde s , t y u son constantes. Cada triple ( s , t , u ) determina una línea, la línea determinada no cambia si se multiplica por un escalar distinto de cero, y al menos uno de s , t y u debe ser distinto de cero. Entonces, el triple ( s , t , u ) puede tomarse como coordenadas homogéneas de una línea en el plano proyectivo, es decir , coordenadas de línea en oposición a coordenadas de puntos. Si en sx  +  ty  +  uz  = 0 las letras s , t y u se toman como variables y x , y y z se toman como constantes, entonces la ecuación se convierte en una ecuación de un conjunto de líneas en el espacio de todas las líneas en el plano. . Geométricamente representa el conjunto de líneas que pasan por el punto ( x , y , z ) y se puede interpretar como la ecuación del punto en líneas-coordenadas. De la misma manera, los planos en el espacio tridimensional pueden recibir conjuntos de cuatro coordenadas homogéneas, y así sucesivamente para dimensiones más altas.

La misma relación, sx + ty + uz = 0 , puede considerarse como la ecuación de una línea o la ecuación de un punto. En general, no hay diferencia algebraica o lógica entre coordenadas homogéneas de puntos y líneas. Entonces, la geometría plana con puntos como elementos fundamentales y la geometría plana con líneas como elementos fundamentales son equivalentes excepto para la interpretación. Esto conduce al concepto de dualidad en geometría proyectiva, el principio de que los roles de puntos y líneas pueden intercambiarse en un teorema en geometría proyectiva y el resultado también será un teorema. De manera análoga, la teoría de los puntos en el espacio tridimensional proyectivo es dual a la teoría de los planos en el espacio tridimensional proyectivo, y así sucesivamente para dimensiones superiores.

Coordenadas de Plücker

Asignar coordenadas a líneas en el espacio tridimensional proyectivo es más complicado, ya que parecería que se requieren un total de 8 coordenadas, ya sea las coordenadas de dos puntos que se encuentran en la línea o dos planos cuya intersección es la línea. Un método útil, debido a Julius Plücker , crea un conjunto de seis coordenadas como determinantes x i y j - x j y i (1 ≤ i < j ≤ 4) a partir de las coordenadas homogéneas de dos puntos ( x 1 , x 2 , x 3 , x 4 ) y ( y 1 , y 2 , y 3 , y 4 ) en la línea. La incrustación de Plücker es la generalización de esta para crear coordenadas homogéneas de elementos de cualquier dimensión m en un espacio proyectivo de dimensión n .

Aplicación al teorema de Bézout

El teorema de Bézout predice que el número de puntos de intersección de dos curvas es igual al producto de sus grados (asumiendo un campo algebraicamente cerrado y con ciertas convenciones seguidas para contar multiplicidades de intersección). El teorema de Bézout predice que hay un punto de intersección de dos líneas y, en general, esto es cierto, pero cuando las líneas son paralelas, el punto de intersección es infinito. Las coordenadas homogéneas se utilizan para localizar el punto de intersección en este caso. De manera similar, el teorema de Bézout predice que una línea intersecará una cónica en dos puntos, pero en algunos casos uno o ambos puntos es infinito y se deben usar coordenadas homogéneas para ubicarlos. Por ejemplo, y = x 2 y x = 0 tienen solo un punto de intersección en el plano finito (afín). Para encontrar el otro punto de intersección, convierta las ecuaciones en forma homogénea, yz = x 2 y x = 0 . Esto produce x = yz = 0 y, suponiendo que no todos x , y y z son 0, las soluciones son x = y = 0, z ≠ 0 y x = z = 0, y ≠ 0 . Esta primera solución es el punto (0, 0) en coordenadas cartesianas, el punto finito de intersección. La segunda solución da las coordenadas homogéneas (0, 1, 0) que corresponden a la dirección del eje y . Para las ecuaciones xy = 1 y x = 0 no hay puntos finitos de intersección. Convertir las ecuaciones en forma homogénea da xy = z 2 y x = 0 . Resolver produce la ecuación z 2 = 0 que tiene una raíz doble en z = 0 . De la ecuación original, x = 0 , entonces y ≠ 0 ya que al menos una coordenada debe ser distinta de cero. Por tanto, (0, 1, 0) es el punto de intersección contado con multiplicidad 2 de acuerdo con el teorema.

Puntos circulares

La forma homogénea de la ecuación de un círculo en el plano proyectivo real o complejo es x 2 + y 2 + 2 axz + 2 byz + c z 2 = 0 . La intersección de esta curva con la línea en el infinito se puede encontrar estableciendo z = 0 . Esto produce la ecuación x 2 + y 2 = 0 que tiene dos soluciones sobre los números complejos, dando lugar a los puntos con coordenadas homogéneas (1, i , 0) y (1, - i , 0) en el plano proyectivo complejo. Estos puntos se denominan puntos circulares en el infinito y pueden considerarse como los puntos comunes de intersección de todos los círculos. Esto se puede generalizar a curvas de orden superior como curvas algebraicas circulares .

Cambio de sistemas de coordenadas

Así como la selección de ejes en el sistema de coordenadas cartesianas es algo arbitraria, la selección de un único sistema de coordenadas homogéneas de todos los sistemas posibles es algo arbitraria. Por tanto, es útil saber cómo se relacionan los diferentes sistemas entre sí.

Sean ( x , y , z ) coordenadas homogéneas de un punto en el plano proyectivo. Una matriz fija

con determinante distinto de cero , define un nuevo sistema de coordenadas ( X , Y , Z ) por la ecuación

La multiplicación de ( x , y , z ) por un escalar da como resultado la multiplicación de ( X , Y , Z ) por el mismo escalar, y X , Y y Z no pueden ser todos 0 a menos que x , y y z sean todos cero, ya que A no es singular. Entonces ( X , Y , Z ) son un nuevo sistema de coordenadas homogéneas para el mismo punto del plano proyectivo.

Coordenadas baricéntricas

La formulación original de Möbius de coordenadas homogéneas especificaba la posición de un punto como el centro de masa (o baricentro) de un sistema de tres masas puntuales colocadas en los vértices de un triángulo fijo. Los puntos dentro del triángulo se representan mediante masas positivas y los puntos fuera del triángulo se representan permitiendo masas negativas. Multiplicar las masas en el sistema por un escalar no afecta el centro de masa, por lo que este es un caso especial de un sistema de coordenadas homogéneas.

Coordenadas trilineales

Sean l , m , n tres rectas en el plano y defina un conjunto de coordenadas X , Y y Z de un punto p como las distancias con signo de p a estas tres rectas. Estas se denominan coordenadas trilineales de p con respecto al triángulo cuyos vértices son las intersecciones por pares de las líneas. Estrictamente hablando, estos no son homogéneos, ya que los valores de X , Y y Z se determinan con exactitud, no solo hasta la proporcionalidad. Sin embargo, existe una relación lineal entre ellos, por lo que estas coordenadas pueden hacerse homogéneas al permitir que los múltiplos de ( X , Y , Z ) representen el mismo punto. Más en general, X , Y y Z pueden ser definidos como constantes p , r y q veces las distancias a l , m y n , lo que resulta en un sistema diferente de coordenadas homogéneas con el mismo triángulo de referencia. Este es, de hecho, el tipo más general de sistema de coordenadas homogéneas para puntos en el plano si ninguna de las líneas es la línea en el infinito.

Uso en gráficos por computadora y visión por computadora

Las coordenadas homogéneas son omnipresentes en los gráficos por computadora porque permiten que las operaciones vectoriales comunes, como traslación , rotación , escalado y proyección en perspectiva, se representen como una matriz por la que se multiplica el vector. Por la regla de la cadena, cualquier secuencia de tales operaciones se puede multiplicar en una sola matriz, lo que permite un procesamiento simple y eficiente. Por el contrario, el uso de coordenadas cartesianas, las traslaciones y la proyección en perspectiva no se pueden expresar como multiplicaciones de matrices, aunque otras operaciones sí. Las tarjetas gráficas OpenGL y Direct3D modernas aprovechan las coordenadas homogéneas para implementar un sombreador de vértices de manera eficiente utilizando procesadores vectoriales con registros de 4 elementos.

Por ejemplo, en la proyección en perspectiva, una posición en el espacio está asociada con la línea que va desde ella hasta un punto fijo llamado centro de proyección . Luego, el punto se asigna a un plano al encontrar el punto de intersección de ese plano y la línea. Esto produce una representación precisa de cómo se ve un objeto tridimensional a la vista. En la situación más simple, el centro de proyección es el origen y los puntos se mapean en el plano z = 1 , trabajando por el momento en coordenadas cartesianas. Para un punto dado en el espacio, ( x , y , z ) , el punto donde la línea y el plano se cruzan es ( x / z , y / z , 1) . Descartando la coordenada z ahora superflua , esto se convierte en ( x / z , y / z ) . En coordenadas homogéneas, el punto ( x , y , z ) está representado por ( xw , yw , zw , w ) y el punto se asigna a en el plano está representado por ( xw , yw , zw ) , por lo que la proyección puede ser representado en forma de matriz como

Las matrices que representan otras transformaciones geométricas se pueden combinar con ésta y entre sí mediante la multiplicación de matrices. Como resultado, cualquier proyección del espacio en perspectiva se puede representar como una sola matriz.

Notas

Referencias

Otras lecturas

enlaces externos

  • Jules Bloomenthal y Jon Rokne, coordenadas homogéneas [1]
  • Ching-Kuang Shene, coordenadas homogéneas [2]
  • Wolfram MathWorld