Distribución multimodal - Multimodal distribution

Figura 1. Una distribución bimodal simple, en este caso una mezcla de dos distribuciones normales con la misma varianza pero diferentes medias. La figura muestra la función de densidad de probabilidad (pdf), que es un promedio igualmente ponderado de los PDF en forma de campana de las dos distribuciones normales. Si los pesos no fueran iguales, la distribución resultante aún podría ser bimodal pero con picos de diferentes alturas.
Figura 2. Una distribución bimodal.
Figura 3. Distribución multimodal bivariada

En estadística , una distribución bimodal es una distribución de probabilidad con dos modos diferentes , que también puede denominarse distribución bimodal. Estos aparecen como picos distintos (máximos locales) en la función de densidad de probabilidad , como se muestra en las Figuras 1 y 2. Los datos categóricos, continuos y discretos pueden formar distribuciones bimodales.

De manera más general, una distribución multimodal es una distribución de probabilidad con dos o más modos, como se ilustra en la Figura 3.

Terminología

Cuando los dos modos son desiguales, el modo más grande se conoce como modo mayor y el otro como modo menor. El valor menos frecuente entre los modos se conoce como antimodo . La diferencia entre los modos mayor y menor se conoce como amplitud . En series de tiempo, el modo principal se llama acrofase y el antimodo batifase .

Clasificación de Galtung

Galtung introdujo un sistema de clasificación (AJUS) para distribuciones:

  • A: distribución unimodal - pico en el medio
  • J: unimodal - pico en cualquier extremo
  • U: bimodal - picos en ambos extremos
  • S: bimodal o multimodal - múltiples picos

Desde entonces, esta clasificación se ha modificado ligeramente:

  • J: (modificado) - pico a la derecha
  • L: unimodal - pico a la izquierda
  • F: sin pico (plano)

Bajo esta clasificación, las distribuciones bimodales se clasifican como tipo S o U.

Ejemplos de

Las distribuciones bimodales ocurren tanto en matemáticas como en ciencias naturales.

Distribuciones de probabilidad

Las distribuciones bimodales importantes incluyen la distribución de arcoseno y la distribución beta . Otros incluyen la distribución U-cuadrática .

La relación de dos distribuciones normales también se distribuye bimodalmente. Dejar

donde un y b son constantes y x y y son distribuidas como variables normales con una media de 0 y una desviación estándar de 1. R tiene una densidad conocida que puede ser expresado como una función hipergeométrica confluente .

La distribución del recíproco de una variable aleatoria distribuida en t es bimodal cuando los grados de libertad son más de uno. De manera similar, el recíproco de una variable distribuida normalmente también se distribuye bimodalmente.

Una estadística t generada a partir de un conjunto de datos extraídos de una distribución de Cauchy es bimodal.

Ocurrencias en la naturaleza

Ejemplos de variables con distribuciones bimodales incluyen el tiempo entre erupciones de ciertos géiseres , el color de las galaxias , el tamaño de las hormigas tejedoras obreras , la edad de incidencia del linfoma de Hodgkin , la velocidad de inactivación del fármaco isoniazida en adultos estadounidenses, la magnitud absoluta de novas , y los patrones de actividad circadiana de esos animales crepusculares que están activos tanto en el crepúsculo matutino como vespertino. En la ciencia pesquera, las distribuciones de tallas multimodales reflejan las diferentes clases de años y, por lo tanto, se pueden utilizar para la distribución por edades y las estimaciones de crecimiento de la población de peces. Los sedimentos suelen distribuirse de forma bimodal. Al muestrear las galerías mineras que cruzan la roca huésped y las vetas mineralizadas, la distribución de las variables geoquímicas sería bimodal. Las distribuciones bimodales también se ven en el análisis de tráfico, donde el tráfico alcanza su punto máximo durante la hora pico de la mañana y luego nuevamente en la hora pico de la tarde. Este fenómeno también se observa en la distribución diaria del agua, ya que la demanda de agua, en forma de duchas, cocina y uso del baño, generalmente alcanza su punto máximo en los períodos matutino y vespertino.

Econometría

En los modelos econométricos , los parámetros pueden estar distribuidos bimodalmente.

Orígenes

Matemático

Una distribución bimodal surge más comúnmente como una mezcla de dos distribuciones unimodales diferentes (es decir, distribuciones que tienen un solo modo). En otras palabras, la variable aleatoria X distribuida bimodalmente se define como con probabilidad o con probabilidad donde Y y Z son variables aleatorias unimodales y es un coeficiente de mezcla.

No es necesario que las mezclas con dos componentes distintos sean bimodales y las mezclas de dos componentes con densidades de componentes unimodales pueden tener más de dos modos. No existe una conexión inmediata entre el número de componentes en una mezcla y el número de modos de la densidad resultante.

Distribuciones particulares

Las distribuciones bimodales, a pesar de su frecuente aparición en conjuntos de datos, solo se han estudiado en raras ocasiones. Esto puede deberse a las dificultades para estimar sus parámetros con métodos frecuentistas o bayesianos. Entre los que se han estudiado se encuentran

  • Distribución exponencial bimodal.
  • Distribución alfa-sesgada-normal.
  • Distribución normal bimodal asimétrica asimétrica.
  • Se ha ajustado una mezcla de distribuciones de Conway-Maxwell-Poisson a los datos de recuento bimodal.

La bimodalidad también surge naturalmente en la distribución de la cúspide de la catástrofe .

Biología

En biología se sabe que cinco factores contribuyen a las distribuciones bimodales de los tamaños de población:

  • la distribución inicial de tamaños individuales
  • la distribución de las tasas de crecimiento entre los individuos
  • el tamaño y la dependencia del tiempo de la tasa de crecimiento de cada individuo
  • tasas de mortalidad que pueden afectar a cada clase de tamaño de manera diferente
  • la metilación del ADN en el genoma humano y de ratón.

La distribución bimodal de tamaños de los trabajadores de la hormiga tejedora surge debido a la existencia de dos clases distintas de trabajadores, a saber, los trabajadores mayores y los trabajadores menores.

La distribución de los efectos de aptitud de las mutaciones tanto para los genomas completos como para los genes individuales también se encuentra con frecuencia que es bimodal, siendo la mayoría de las mutaciones neutrales o letales, y relativamente pocas tienen un efecto intermedio.

Propiedades generales

Una mezcla de dos distribuciones unimodales con diferentes medias no es necesariamente bimodal. La distribución combinada de alturas de hombres y mujeres se usa a veces como un ejemplo de distribución bimodal, pero de hecho la diferencia en las alturas medias de hombres y mujeres es demasiado pequeña en relación con sus desviaciones estándar para producir bimodalidad.

Las distribuciones bimodales tienen la propiedad peculiar de que, a diferencia de las distribuciones unimodales, la media puede ser un estimador muestral más robusto que la mediana. Este es claramente el caso cuando la distribución tiene forma de U como la distribución de arcoseno. Puede que no sea cierto cuando la distribución tiene una o más colas largas.

Momentos de mezclas

Dejar

donde g i es una distribución de probabilidad yp es el parámetro de mezcla.

Los momentos de f ( x ) son

dónde

y S i y K i son la asimetría y la curtosis de la i- ésima distribución.

Mezcla de dos distribuciones normales

No es raro encontrar situaciones en las que un investigador crea que los datos provienen de una mezcla de dos distribuciones normales. Debido a esto, esta mezcla se ha estudiado con cierto detalle.

Una mezcla de dos distribuciones normales tiene cinco parámetros para estimar: las dos medias, las dos varianzas y el parámetro de mezcla. Una mezcla de dos distribuciones normales con desviaciones estándar iguales es bimodal solo si sus medias difieren en al menos el doble de la desviación estándar común. Las estimaciones de los parámetros se simplifican si se puede suponer que las varianzas son iguales (el caso homoscedástico ).

Si las medias de las dos distribuciones normales son iguales, entonces la distribución combinada es unimodal. Eisenberger derivó las condiciones para la unimodalidad de la distribución combinada. Ray y Lindsay han identificado las condiciones necesarias y suficientes para que una mezcla de distribuciones normales sea bimodal.

Una mezcla de dos distribuciones normales de masa aproximadamente iguales tiene una curtosis negativa ya que los dos modos a cada lado del centro de masa reducen efectivamente las colas de la distribución.

Una mezcla de dos distribuciones normales con una masa muy desigual tiene una curtosis positiva ya que la distribución más pequeña alarga la cola de la distribución normal más dominante.

Las mezclas de otras distribuciones requieren la estimación de parámetros adicionales.

Pruebas de unimodalidad

o

donde p es el parámetro de mezcla y

y donde μ 1 y μ 2 son las medias de las dos distribuciones normales y σ 1 y σ 2 son sus desviaciones estándar.

  • La siguiente prueba para el caso p = 1/2 fue descrita por Schilling et al . Dejar

El factor de separación ( S ) es

Si las varianzas son iguales, entonces S = 1. La densidad de la mezcla es unimodal si y solo si

  • Una condición suficiente para la unimodalidad es
  • Si las dos distribuciones normales tienen desviaciones estándar iguales, una condición suficiente para la unimodalidad es

Resumen estadístico

Las distribuciones bimodales son un ejemplo de uso común de cómo las estadísticas resumidas, como la media , la mediana y la desviación estándar, pueden ser engañosas cuando se utilizan en una distribución arbitraria. Por ejemplo, en la distribución de la Figura 1, la media y la mediana serían aproximadamente cero, aunque cero no es un valor típico. La desviación estándar también es mayor que la desviación de cada distribución normal.

Aunque se han sugerido varios, actualmente no existe una estadística resumida (o un conjunto de estadísticas) generalmente acordada para cuantificar los parámetros de una distribución bimodal general. Para una mezcla de dos distribuciones normales, generalmente se usan las medias y las desviaciones estándar junto con el parámetro de mezcla (el peso de la combinación), un total de cinco parámetros.

D de Ashman

Una estadística que puede resultar útil es la D de Ashman:

donde μ 1 , μ 2 son las medias y σ 1 σ 2 son las desviaciones estándar.

Para una mezcla de dos distribuciones normales, se requiere D > 2 para una separación limpia de las distribuciones.

A de van der Eijk

Esta medida es un promedio ponderado del grado de concordancia de la distribución de frecuencias. A varía de -1 ( bimodalidad perfecta ) a +1 ( unimodalidad perfecta ). Se define como

donde U es la unimodalidad de la distribución, S el número de categorías que tienen frecuencias distintas de cero y K el número total de categorías.

El valor de U es 1 si la distribución tiene alguna de las tres características siguientes:

  • todas las respuestas están en una sola categoría
  • las respuestas se distribuyen uniformemente entre todas las categorías
  • las respuestas se distribuyen uniformemente entre dos o más categorías contiguas, con las otras categorías con cero respuestas

Con distribuciones distintas a estas, los datos deben dividirse en "capas". Dentro de una capa, las respuestas son iguales o nulas. No es necesario que las categorías sean contiguas. Se calcula un valor de A para cada capa ( A i ) y se determina un promedio ponderado para la distribución. Los pesos ( w i ) para cada capa son el número de respuestas en esa capa. En simbolos

Una distribución uniforme tiene A = 0: cuando todas las respuestas caen en una categoría A = +1.

Un problema teórico con este índice es que asume que los intervalos están igualmente espaciados. Esto puede limitar su aplicabilidad.

Separación bimodal

Este índice asume que la distribución es una mezcla de dos distribuciones normales con medias ( μ 1 y μ 2 ) y desviaciones estándar ( σ 1 y σ 2 ):

Coeficiente de bimodalidad

El coeficiente b de bimodalidad de Sarle es

donde γ es la asimetría y κ es la curtosis . La curtosis se define aquí como el cuarto momento estandarizado alrededor de la media. El valor de b se encuentra entre 0 y 1. La lógica detrás de este coeficiente es que una distribución bimodal con colas claras tendrá una curtosis muy baja, un carácter asimétrico o ambos, todo lo cual aumenta este coeficiente.

La fórmula para una muestra finita es

donde n es el número de elementos de la muestra, g es la asimetría de la muestra y k es el exceso de curtosis de la muestra .

El valor de b para la distribución uniforme es 5/9. Este es también su valor para la distribución exponencial . Los valores superiores a 5/9 pueden indicar una distribución bimodal o multimodal, aunque los valores correspondientes también pueden resultar en distribuciones unimodales muy sesgadas. El valor máximo (1.0) se alcanza solo mediante una distribución de Bernoulli con solo dos valores distintos o la suma de dos funciones delta de Dirac diferentes (una distribución bi-delta).

Se desconoce la distribución de esta estadística. Está relacionado con una estadística propuesta anteriormente por Pearson: la diferencia entre la curtosis y el cuadrado de la asimetría ( vide infra ).

Amplitud de bimodalidad

Esto se define como

donde A 1 es la amplitud del pico más pequeño y A an es la amplitud del antimodo.

A B es siempre <1. Los valores más grandes indican picos más distintos.

Relación bimodal

Esta es la proporción de los picos izquierdo y derecho. Matemáticamente

donde A l y A r son las amplitudes de los picos izquierdo y derecho respectivamente.

Parámetro de bimodalidad

Este parámetro ( B ) se debe a Wilcock.

donde A l y A r son las amplitudes de los picos izquierdo y derecho respectivamente y P i es el logaritmo llevado a la base 2 de la proporción de la distribución en el i- ésimo intervalo. El valor máximo de ΣP es 1 pero el valor de B puede ser mayor que este.

Para utilizar este índice, se toman el logaritmo de los valores. A continuación, los datos se dividen en un intervalo de ancho Φ cuyo valor es log 2. El ancho de los picos se considera cuatro veces 1 / 4Φ centrado en sus valores máximos.

Índices de bimodalidad

Índice de Wang

El índice de bimodalidad propuesto por Wang et al asume que la distribución es una suma de dos distribuciones normales con varianzas iguales pero medias diferentes. Se define de la siguiente manera:

donde μ 1 , μ 2 son las medias y σ es la desviación estándar común.

donde p es el parámetro de mezcla.

Índice de Sturrock

Sturrock ha propuesto un índice de bimodalidad diferente.

Este índice ( B ) se define como

Cuando m = 2 y γ se distribuye uniformemente, B se distribuye exponencialmente.

Esta estadística es una forma de periodograma . Sufre los problemas habituales de estimación y fuga espectral comunes a esta forma de estadística.

índice de Michele y Accatino

De Michele y Accatino han propuesto otro índice de bimodalidad. Su índice ( B ) es

donde μ es la media aritmética de la muestra y

donde m i es el número de puntos de datos en el i- ésimo contenedor, x i es el centro del i- ésimo contenedor y L es el número de contenedores.

Los autores sugirieron un valor de corte de 0,1 para B para distinguir entre una distribución bimodal ( B > 0,1) y unimodal ( B <0,1). No se ofreció ninguna justificación estadística para este valor.

Índice de Sambrook Smith

Un índice adicional ( B ) ha sido propuesto por Sambrook Smith et al

donde p 1 y p 2 son la proporción contenida en el modo primario (el de mayor amplitud) y secundario (el de menor amplitud) y φ 1 y φ 2 son los tamaños φ del modo primario y secundario. El tamaño φ se define como menos una vez el logaritmo del tamaño de los datos llevado a la base 2. Esta transformación se usa comúnmente en el estudio de sedimentos.

Los autores recomendaron un valor de corte de 1,5, siendo B mayor que 1,5 para una distribución bimodal y menos de 1,5 para una distribución unimodal. No se proporcionó ninguna justificación estadística para este valor.

Índice de Chaudhuri y Agrawal

Chaudhuri y Agrawal han propuesto otro parámetro de bimodalidad. Este parámetro requiere el conocimiento de las varianzas de las dos subpoblaciones que componen la distribución bimodal. Se define como

donde n i es el número de puntos de datos en la i ésima subpoblación, σ i 2 es la varianza de la i ésima subpoblación, m es el tamaño total de la muestra y σ 2 es la varianza de la muestra.

Es un promedio ponderado de la varianza. Los autores sugieren que este parámetro se puede utilizar como objetivo de optimización para dividir una muestra en dos subpoblaciones. No se dio ninguna justificación estadística para esta sugerencia.

Pruebas estadísticas

Hay varias pruebas disponibles para determinar si un conjunto de datos se distribuye de forma bimodal (o multimodal).

Métodos gráficos

En el estudio de los sedimentos, el tamaño de las partículas suele ser bimodal. Empíricamente, se ha encontrado útil trazar la frecuencia frente al logaritmo (tamaño) de las partículas. Esto generalmente da una clara separación de las partículas en una distribución bimodal. En aplicaciones geológicas, el logaritmo normalmente se lleva a la base 2. Los valores logarítmicos transformados se denominan unidades phi (Φ). Este sistema se conoce como escala Krumbein (o phi).

Un método alternativo es graficar el logaritmo del tamaño de partícula frente a la frecuencia acumulada. Este gráfico generalmente constará de dos líneas razonablemente rectas con una línea de conexión correspondiente al antimodo.

Estadísticas

Los valores aproximados para varias estadísticas se pueden derivar de los diagramas gráficos.

donde Media es la media, StdDev es la desviación estándar, Skew es la asimetría, Kurt es la curtosis y φ x es el valor de la variable φ en el x- ésimo porcentaje de la distribución.

Distribución unimodal frente a bimodal

Pearson en 1894 fue el primero en idear un procedimiento para probar si una distribución podía resolverse en dos distribuciones normales. Este método requería la solución de un polinomio de noveno orden . En un artículo posterior, Pearson informó que para cualquier asimetría de distribución 2 + 1 <curtosis. Más tarde Pearson demostró que

donde b 2 es la curtosis y b 1 es el cuadrado de la asimetría. La igualdad es válida solo para la distribución de Bernoulli de dos puntos o la suma de dos funciones delta de Dirac diferentes . Estos son los casos más extremos de bimodalidad posibles. La curtosis en ambos casos es 1. Como ambos son simétricos, su asimetría es 0 y la diferencia es 1.

Baker propuso una transformación para convertir una distribución bimodal en una unimodal.

Se han propuesto varias pruebas de unimodalidad versus bimodalidad: Haldane sugirió una basada en segundas diferencias centrales. Larkin introdujo más tarde una prueba basada en la prueba F; Benett creó uno basado en la prueba G de Fisher . Tokeshi ha propuesto una cuarta prueba. Holzmann y Vollmer han propuesto una prueba basada en una razón de verosimilitud.

Se ha propuesto un método basado en la puntuación y las pruebas de Wald. Este método puede distinguir entre distribuciones unimodales y bimodales cuando se conocen las distribuciones subyacentes.

Pruebas antimodo

Se conocen las pruebas estadísticas para el antimodo.

El método de Otsu

El método de Otsu se emplea comúnmente en gráficos por computadora para determinar la separación óptima entre dos distribuciones.

Pruebas generales

Para probar si una distribución es diferente a unimodal, se han diseñado varias pruebas adicionales: la prueba de ancho de banda , la prueba de inmersión , la prueba de exceso de masa , la prueba de MAP, la prueba de existencia de modo , la prueba de runt , la prueba de tramo y el asiento. prueba .

Una aplicación de la prueba de inmersión está disponible para el lenguaje de programación R . Los valores p para los valores de la estadística de inmersión oscilan entre 0 y 1. Los valores p inferiores a 0,05 indican multimodalidad significativa y los valores p superiores a 0,05 pero inferiores a 0,10 sugieren multimodalidad con significación marginal.

Prueba de Silverman

Silverman introdujo un método de arranque para el número de modos. La prueba utiliza un ancho de banda fijo que reduce la potencia de la prueba y su interpretabilidad. Las densidades poco suavizadas pueden tener un número excesivo de modos cuyo recuento durante el arranque es inestable.

Prueba de Bajgier-Aggarwal

Bajgier y Aggarwal han propuesto una prueba basada en la curtosis de la distribución.

Casos especiales

Hay pruebas adicionales disponibles para varios casos especiales:

Mezcla de dos distribuciones normales

Un estudio de una mezcla de datos de densidad de dos distribuciones normales encontró que la separación en las dos distribuciones normales era difícil a menos que las medias estuvieran separadas por 4-6 desviaciones estándar.

En astronomía, el algoritmo Kernel Mean Matching se utiliza para decidir si un conjunto de datos pertenece a una única distribución normal oa una mezcla de dos distribuciones normales.

Distribución beta-normal

Esta distribución es bimodal para ciertos valores de sus parámetros. Se ha descrito una prueba para estos valores.

Estimación de parámetros y curvas de ajuste

Suponiendo que se sabe que la distribución es bimodal o que se ha demostrado que es bimodal mediante una o más de las pruebas anteriores, con frecuencia es deseable ajustar una curva a los datos. Esto puede resultar difícil.

Los métodos bayesianos pueden resultar útiles en casos difíciles.

Software

Dos distribuciones normales

Un paquete para R está disponible para probar la bimodalidad. Este paquete asume que los datos se distribuyen como una suma de dos distribuciones normales. Si esta suposición no es correcta, es posible que los resultados no sean fiables. También incluye funciones para ajustar una suma de dos distribuciones normales a los datos.

Suponiendo que la distribución es una mezcla de dos distribuciones normales, se puede utilizar el algoritmo de maximización de expectativas para determinar los parámetros. Hay varios programas disponibles para esto, incluido Cluster y el paquete R nor1mix.

Otras distribuciones

El paquete mixtools disponible para R puede probar y estimar los parámetros de varias distribuciones diferentes. Está disponible un paquete para una mezcla de dos distribuciones gamma de cola derecha.

Varios otros paquetes para R están disponibles para adaptarse a modelos de mezcla; estos incluyen flexmix, mcclust, agrmt y mixdist.

El lenguaje de programación estadística SAS también puede adaptarse a una variedad de distribuciones mixtas con el procedimiento PROC FREQ.

Ver también

Referencias