Cuadros por segundo - Frame rate

Velocidad de fotogramas (expresada en fotogramas por segundo oFPS) es lafrecuencia(velocidad) a la quese capturan o muestranimágenesconsecutivas(fotogramas). El término se aplica igualmente acámaras depelículayvideo,gráficos por computadoraysistemas decaptura de movimiento. La velocidad de fotogramas también se puede llamarfrecuencia de cuadro y expresarse enhercios. La velocidad de fotogramas en las especificaciones de las cámaras electrónicas puede referirse a la velocidad máxima posible, donde, en la práctica, otros ajustes (como el tiempo de exposición) pueden reducir la frecuencia a un número menor.

Visión humana

La sensibilidad temporal y la resolución de la visión humana varía según el tipo y las características del estímulo visual, y difiere entre los individuos. El sistema visual humano puede procesar de 10 a 12 imágenes por segundo y percibirlas individualmente, mientras que las tasas más altas se perciben como movimiento. La luz modulada (como la pantalla de una computadora ) es percibida como estable por la mayoría de los participantes en los estudios cuando la frecuencia es superior a 50 Hz. Esta percepción de luz modulada como constante se conoce como umbral de fusión de parpadeo . Sin embargo, cuando la luz modulada no es uniforme y contiene una imagen, el umbral de fusión de parpadeo puede ser mucho más alto, en cientos de hercios. Con respecto al reconocimiento de imágenes , se ha descubierto que las personas reconocen una imagen específica en una serie ininterrumpida de imágenes diferentes, cada una de las cuales dura tan solo 13 milisegundos. La persistencia de la visión a veces explica un estímulo visual muy corto de un milisegundo que tiene una duración percibida de entre 100 ms y 400 ms. Los estímulos múltiples que son muy cortos a veces se perciben como un solo estímulo, como un destello de luz verde de 10 ms seguido inmediatamente por un destello de luz roja de 10 ms percibido como un solo destello de luz amarilla.

Cine y video

Películas mudas

Las primeras películas mudas habían establecido velocidades de cuadro entre 16 y 24 cuadros por segundo (fps), pero dado que las cámaras se accionaban manualmente, la velocidad a menudo cambiaba durante la escena para adaptarse al estado de ánimo. Los proyeccionistas también podrían cambiar la velocidad de fotogramas en el cine ajustando un reóstato que controla el voltaje que alimenta el mecanismo de transporte de la película en el proyector . Las compañías cinematográficas a menudo tenían la intención de que los cines mostraran sus películas mudas a velocidades de cuadro más altas de las que fueron filmadas. Estas velocidades de cuadro fueron suficientes para la sensación de movimiento, pero se percibió como un movimiento entrecortado. Para minimizar el parpadeo percibido, los proyectores empleaban obturadores de doble y triple hoja , por lo que cada fotograma se mostraba dos o tres veces, lo que aumentaba la frecuencia de parpadeo a 48 o 72 hercios y reducía la fatiga visual. Thomas Edison dijo que 46 cuadros por segundo era el mínimo necesario para que el ojo perciba el movimiento: "Cualquier cosa menos fatigará el ojo". A mediados y finales de la década de 1920, la velocidad de fotogramas de las películas mudas aumentó entre 20 y 26 FPS.

Películas sonoras

Cuando se introdujo la película sonora en 1926, ya no se toleraban las variaciones en la velocidad de la película, ya que el oído humano es más sensible que el ojo a los cambios de frecuencia. Muchos cines habían proyectado películas mudas de 22 a 26 FPS, razón por la cual la industria eligió 24 FPS para películas sonoras como un compromiso. De 1927 a 1930, a medida que varios estudios actualizaron el equipo, la velocidad de 24 FPS se convirtió en estándar para películas de sonido de 35 mm. A 24 FPS, la película viaja a través del proyector a una velocidad de 456 milímetros (18,0 pulgadas) por segundo. Esto permitió que los obturadores simples de dos hojas dieran una serie de imágenes proyectadas a 48 por segundo, satisfaciendo la recomendación de Edison. Muchos proyectores de película modernos de 35 mm utilizan obturadores de tres hojas para producir 72 imágenes por segundo; cada fotograma se muestra en la pantalla tres veces.

Animación

Esta caricatura animada de un caballo al galope se muestra a 12 dibujos por segundo, y el movimiento rápido está al borde de ser objetablemente espasmódico.

En la animación dibujada , los personajes en movimiento suelen filmarse "de dos en dos", es decir, se muestra un dibujo por cada dos fotogramas de la película (que suele correr a 24 fotogramas por segundo), lo que significa que solo hay 12 dibujos por segundo. Aunque la frecuencia de actualización de la imagen es baja, la fluidez es satisfactoria para la mayoría de los sujetos. Sin embargo, cuando se requiere que un personaje realice un movimiento rápido, generalmente es necesario volver a animar "en unos", ya que los "dos" son demasiado lentos para transmitir el movimiento de manera adecuada. Una combinación de las dos técnicas mantiene el ojo engañado sin costos de producción innecesarios.

La animación de la mayoría de los " dibujos animados de los sábados por la mañana " se produjo de la forma más barata posible y la mayoría de las veces se rodó en "tres" o incluso "cuatro", es decir, tres o cuatro fotogramas por dibujo. Esto se traduce en solo 8 o 6 dibujos por segundo respectivamente. El anime también se dibuja generalmente en grupos de tres.

Estándares de video modernos

Debido a la frecuencia de red de las redes eléctricas, la transmisión de televisión analógica se desarrolló con velocidades de cuadro de 50 Hz (la mayor parte del mundo) o 60 Hz (Canadá, EE. UU., Japón, Corea del Sur). La frecuencia de la red eléctrica era extremadamente estable y, por lo tanto, era lógico utilizarla para la sincronización.

La introducción de la tecnología de televisión en color hizo necesario reducir esa frecuencia de 60 FPS en un 0,1% para evitar el " rastreo de puntos ", un artefacto de visualización que aparece en las pantallas antiguas en blanco y negro, que se muestra en superficies muy saturadas de color. Se descubrió que al reducir la velocidad de fotogramas en un 0,1%, se minimizaba el efecto indeseable.

A partir de 2021, los estándares de transmisión de video en América del Norte, Japón y Corea del Sur todavía se basan en 60 / 1.001 ≈ 59.94 imágenes por segundo. Normalmente se utilizan dos tamaños de imágenes: 1920 × 1080 ("1080i") y 1280 × 720 ("720p"). De manera confusa, los formatos entrelazados se expresan habitualmente a la mitad de su velocidad de imagen, 29,97 FPS y al doble de la altura de la imagen, pero estas afirmaciones son puramente personalizadas; en cada formato se producen 60 imágenes por segundo. Una resolución de 1080i produce 59,94 imágenes de 1920 × 540, cada una aplastada a la mitad de la altura en el proceso fotográfico y estirada hacia atrás para llenar la pantalla durante la reproducción en un televisor. El formato de 720p produce 59,94 imágenes de 1280 × 720p, sin comprimir, por lo que no es necesario expandir o comprimir la imagen. Esta confusión se extendió a toda la industria en los primeros días del software de video digital, con mucho software escrito incorrectamente, los codificadores creían que solo se esperaban 29.97 imágenes por segundo, lo cual era incorrecto. Si bien era cierto que cada elemento de la imagen se sondeaba y se enviaba solo 29,97 veces por segundo, la ubicación del píxel inmediatamente debajo de ese se sondeaba 1/60 de segundo más tarde, parte de una imagen completamente separada para el siguiente fotograma de 1/60 de segundo. .

La película, a su velocidad nativa de 24 FPS, no podría mostrarse sin el proceso de extracción necesario , lo que a menudo conduce a una "vibración": para convertir 24 fotogramas por segundo en 60 fotogramas por segundo, cada fotograma impar se repite, se reproduce dos veces, mientras que cada fotograma par se triplica. Esto crea un movimiento desigual, que parece estroboscópico. Otras conversiones tienen una duplicación de marco desigual similar. Los estándares de video más nuevos admiten 120, 240 o 300 fotogramas por segundo, por lo que los fotogramas se pueden muestrear uniformemente para velocidades de fotogramas estándar, como películas de 24, 48 y 60 FPS o videos de 25, 30, 50 o 60 FPS. Por supuesto, estas velocidades de cuadro más altas también pueden mostrarse a sus velocidades nativas.

La velocidad de fotogramas en las especificaciones de las cámaras electrónicas puede referirse a la velocidad máxima posible, donde, en la práctica, otros ajustes (como el tiempo de exposición) pueden reducir la frecuencia a un número menor.

Conversión ascendente de velocidad de fotogramas

La conversión ascendente de la velocidad de fotogramas es el proceso de aumentar la resolución temporal de una secuencia de vídeo sintetizando uno o más fotogramas intermedios entre dos fotogramas consecutivos. Una velocidad de fotogramas baja produce aliasing , produce artefactos de movimiento abruptos y degrada la calidad del video. En consecuencia, la resolución temporal es un factor importante que afecta la calidad del video. Los algoritmos para FRC se utilizan ampliamente en aplicaciones, incluida la mejora de la calidad visual, la compresión de video y la generación de video en cámara lenta.

Video de baja velocidad de fotogramas
Vídeo con una frecuencia de fotogramas 4 veces mayor

Métodos

La mayoría de los métodos de FRC se pueden clasificar en métodos de flujo óptico o basados ​​en kernel y basados ​​en alucinaciones de píxeles.

FRC basado en flujo

Los métodos basados ​​en flujo combinan linealmente los flujos ópticos predichos entre dos tramas de entrada para aproximar los flujos desde la trama intermedia de destino a las tramas de entrada. También proponen inversión de flujo (proyección) para una deformación de imagen más precisa . Además, existen algoritmos que dan diferentes pesos de vectores de flujo superpuestos dependiendo de la profundidad del objeto de la escena a través de una capa de proyección de flujo.

FRC basado en alucinaciones de píxeles

Los métodos basados ​​en la alucinación de píxeles utilizan una convolución deformable en el generador del marco central reemplazando los flujos ópticos con vectores de compensación. Hay algoritmos que también interpolan fotogramas intermedios con la ayuda de convolución deformable en el dominio de características. Sin embargo, dado que estos métodos alucinan directamente los píxeles a diferencia de los métodos FRC basados ​​en flujo, los fotogramas predichos tienden a ser borrosos cuando hay presentes objetos que se mueven rápidamente.

Instrumentos

Herramienta Disponibilidad Multiplicador de aumento de fotograma máximo
Adobe Premiere Pro Comercial, prueba gratuita de 7 días 100
Vegas Pro Comercial, prueba gratuita de 30 días 100
Filtro de conversión de velocidad de fotogramas de AviSynth MSU Comercial Cualquier número entero positivo
Convertidor de frecuencia de cuadro avanzado (AFRC) Gratis Cualquier número entero positivo
Topaz Video Enhance AI Comercial, prueba gratuita de 30 días 100
  • Adobe Premiere Pro : Adobe Premiere Pro es un programa de software de edición de vídeo comercial que le permite ralentizar su vídeo mediante el flujo óptico y los efectos de reasignación de tiempo a las imágenes grabadas de forma convencional para crear una cámara lenta de mejor aspecto y más suave.
  • Vegas Pro - Vegas Pro también es un programa de software de edición de video comercial. También hay un método para hacer videos en cámara lenta. Para realizarlo, debe elegir la magnitud del movimiento en su video y los porcentajes de velocidad de reproducción.
  • Filtro de conversión de frecuencia de fotogramas de AviSynth MSU: el filtro de conversión de frecuencia de fotogramas de AviSynth MSU es una herramienta de código abierto destinada a la conversión de frecuencia de fotogramas de vídeo. Aumenta los tiempos enteros de la velocidad de fotogramas. Permite, por ejemplo, convertir un video con 15 fps en un video con 30 fps.
  • Conversor de frecuencia de cuadro avanzado (AFRC) : la principal ventaja del algoritmo AFRC es el uso de varias técnicas de mejora de la calidad, como el enmascaramiento adaptativo de artefactos, el procesamiento de rayas negras y el seguimiento de oclusiones:
    • La técnica de enmascaramiento de artefactos adaptativos permite hacer que los artefactos sean menos perceptibles para los ojos, aumentando así la calidad integral del video procesado;
    • El procesamiento de franjas negras permite evitar los artefactos que aparecen comúnmente en los fotogramas interpolados en caso de que la franja negra se presente cerca de los bordes del fotograma;
    • El seguimiento de oclusión realiza una restauración de alta calidad de los fotogramas interpolados cerca de los bordes en caso de presencia de movimiento con dirección hacia / desde el borde del fotograma.
  • Topaz Video Enhance AI : Topaz Video Enhance AI tiene el modelo Chronos AI que utiliza el aprendizaje profundo para aumentar la velocidad de fotogramas de video sin artefactos. Este algoritmo genera nuevos fotogramas que a menudo son indistinguibles de los fotogramas capturados en la cámara.

Ver también

Referencias

enlaces externos

( Copia de Wayback Machine )