Envolvente MPEG - MPEG Surround

MPEG Surround ( ISO / IEC 23003-1 o MPEG-D Parte 1), también conocido como Spatial Audio Coding (SAC), es un formato de compresión con pérdida para sonido envolvente que proporciona un método para extender los servicios de audio mono o estéreo a audio multicanal. de una manera compatible con versiones anteriores. Las tasas de bits totales utilizadas para el núcleo (mono o estéreo) y los datos de MPEG Surround suelen ser solo un poco más altas que las tasas de bits utilizadas para la codificación del núcleo (mono o estéreo). MPEG Surround agrega un flujo de información lateral al flujo de bits del núcleo (mono o estéreo) , que contiene datos de imágenes espaciales. Los sistemas de reproducción estéreo heredados ignorarán esta información lateral, mientras que los reproductores que admitan la decodificación MPEG Surround emitirán el audio multicanal reconstruido.

Moving Picture Experts Group (MPEG) emitió una convocatoria de propuestas sobre codificación de audio espacial MPEG en marzo de 2004. El grupo decidió que la tecnología que sería el punto de partida en el proceso de estandarización sería una combinación de las presentaciones de dos proponentes: Fraunhofer IIS / Agere Systems y tecnologías de codificación / Philips. El estándar MPEG Surround fue desarrollado por Moving Picture Experts Group ( ISO / IEC JTC1 / SC29 / WG11) y publicado como ISO / IEC 23003 en 2007. Fue el primer estándar del grupo de estándares MPEG-D, formalmente conocido como ISO / IEC 23003 - Tecnologías de audio MPEG .

MPEG Surround también se definió como uno de los tipos de objetos de audio MPEG-4 en 2007. También existe el tipo de objeto MPEG-4 No Delay MPEG Surround (LD MPEG Surround), que se publicó en 2010. La codificación de objetos de audio espacial (SAOC ) se publicó como MPEG-D Parte 2 - ISO / IEC 23003-2 en 2010 y amplía el estándar MPEG Surround al reutilizar sus capacidades de reproducción espacial al tiempo que conserva la compatibilidad total con los receptores existentes. El sistema MPEG SAOC permite a los usuarios del lado de la decodificación controlar interactivamente la reproducción de cada objeto de audio individual (por ejemplo, instrumentos individuales, voces, voces humanas). También existe la codificación unificada de voz y audio (USAC), que se definirá en MPEG-D Parte 3 - ISO / IEC 23003-3 e ISO / IEC 14496-3: 2009 / Amd 3. Herramientas de codificación paramétrica MPEG-D MPEG Surround están integrados en el códec USAC.

El núcleo (mono o estéreo) se puede codificar con cualquier códec de audio ( con o sin pérdida ) . Son posibles velocidades de bits particularmente bajas (64-96 kbit / s para 5.1 canales) cuando se utiliza HE-AAC v2 como códec principal.

Percepción de sonidos en el espacio

La codificación MPEG Surround utiliza nuestra capacidad para percibir el sonido en 3D y captura esa percepción en un conjunto compacto de parámetros. La percepción espacial se atribuye principalmente a tres parámetros, o señales, que describen cómo los humanos localizan el sonido en el plano horizontal: diferencia de nivel interaural (ILD), diferencia de tiempo interaural (ITD) y coherencia interaural (IC). Estos tres conceptos se ilustran en la siguiente imagen. Las formas de onda directas, o de primera llegada, de la fuente golpean el oído izquierdo en un momento, mientras que el sonido directo recibido por el oído derecho se difracta alrededor de la cabeza, con retardo de tiempo y atenuación de nivel asociados. Estos dos efectos dan como resultado ITD y ILD están asociados con la fuente principal. Por último, en un entorno reverberante, el sonido reflejado de la fuente, o el sonido de la fuente difusa, o el sonido no correlacionado puede llegar a ambos oídos, todos ellos relacionados con IC. Figura 1.  Ilustración de ILD, ITD e IC

Descripción

MPEG Surround utiliza diferencias de nivel, fase y coherencia entre canales equivalentes a los parámetros ILD, ITD e IC. La imagen espacial es capturada por una señal de audio multicanal relativa a una señal de mezcla descendente transmitida. Estos parámetros están codificados de forma muy compacta para decodificar los parámetros y la señal transmitida y sintetizar una representación multicanal de alta calidad.

Principios de la codificación envolvente MPEG

Codificador MPEG Surround recibe una multicanal x1 señal de audio a xN donde el número de canales de entrada es N . El aspecto más importante del proceso de codificación es que una señal de mezcla descendente, xt1 y xt2, que normalmente es estéreo, se deriva de la señal de entrada multicanal, y es esta señal de mezcla descendente la que se comprime para la transmisión a través del canal en lugar de la señal multicanal. . El codificador puede aprovechar el proceso de downmix para ser más ventajoso. No solo crea un equivalente fiel de la señal multicanal en el downmix mono o estéreo, sino que también crea la mejor decodificación multicanal posible basada en el downmix y también en las señales espaciales codificadas. Alternativamente, el downmix podría suministrarse externamente (Artistic Downmix antes del bloque de diagrama). El proceso de codificación MPEG Surround podría ser ignorado por el algoritmo de compresión utilizado para los canales transmitidos (codificador de audio y decodificador de audio antes del bloque de diagrama). Podría ser cualquier tipo de algoritmo de compresión de alto rendimiento como MPEG-1 Layer III, MPEG-4 AAC o MPEG-4 High Efficiency AAC, o incluso podría ser PCM.

Compatibilidad heredada

La técnica MPEG Surround permite la compatibilidad con decodificadores MPEG estéreo existentes y futuros al hacer que la mezcla descendente transmitida (por ejemplo, estéreo) parezca a los decodificadores MPEG estéreo como una versión estéreo ordinaria de la señal multicanal. La compatibilidad con decodificadores estéreo es deseable ya que la presentación estéreo seguirá siendo omnipresente debido a la cantidad de aplicaciones en las que escuchar se realiza principalmente a través de auriculares, como reproductores de música portátiles.

MPEG Surround también admite un modo en el que el downmix es compatible con los decodificadores envolventes matriciales populares, como Dolby Pro-Logic .

Aplicaciones

Transmisión de audio digital

Debido al ancho de banda de canal relativamente pequeño, el costo relativamente alto de los equipos de transmisión y las licencias de transmisión y el deseo de maximizar las opciones del usuario proporcionando muchos programas, la mayoría de los sistemas de transmisión digital existentes o planificados no pueden proporcionar sonido multicanal a los usuarios.

DRM + fue diseñado para ser totalmente capaz de transmitir MPEG Surround y dicha transmisión también se demostró con éxito.

La compatibilidad con versiones anteriores de MPEG Surround y la sobrecarga relativamente baja proporcionan una forma de agregar sonido multicanal a DAB sin reducir drásticamente la calidad del audio ni afectar a otros servicios.

Difusión de televisión digital

Actualmente, la mayoría de las transmisiones de televisión digital utilizan codificación de audio estéreo. MPEG Surround podría usarse para extender estos servicios establecidos al sonido envolvente, como con DAB.

Servicio de descarga de música

Actualmente, varios servicios comerciales de descarga de música están disponibles y funcionan con un éxito comercial considerable. Dichos servicios podrían ampliarse sin problemas para proporcionar presentaciones multicanal sin dejar de ser compatibles con reproductores estéreo: en computadoras con sistemas de reproducción de 5.1 canales, los archivos de sonido comprimidos se presentan en sonido envolvente, mientras que en reproductores portátiles los mismos archivos se reproducen en estéreo.

Servicio de transmisión de música / radio por Internet

Muchas radios de Internet funcionan con un ancho de banda de transmisión muy limitado, de modo que solo pueden ofrecer contenido mono o estéreo. La tecnología de codificación envolvente MPEG podría extender esto a un servicio multicanal sin dejar de estar dentro del rango operativo permisible de tasas de bits. Dado que la eficiencia es de suma importancia en esta aplicación, la compresión de la señal de audio transmitida es vital. Utilizando la tecnología de compresión MPEG reciente (codificación de perfil de alta eficiencia MPEG-4), se han demostrado sistemas envolventes MPEG completos con velocidades de bits tan bajas como 48 kbit / s.

Ver también

Referencias

enlaces externos