Función logística - Logistic function

Función sigmoide logística estándar donde

Una función logística o curva logística es una curva en forma de S común ( curva sigmoidea ) con ecuación

dónde

, el valor del punto medio del sigmoide;
, el valor máximo de la curva;
, la tasa de crecimiento logístico o la pendiente de la curva.

Para los valores de en el dominio de los números reales de a , se obtiene la curva S que se muestra a la derecha, con la gráfica de acercarse a medida que se acerca y acercarse a cero a medida que se acerca .

La función logística encuentra aplicaciones en una variedad de campos, que incluyen biología (especialmente ecología ), biomatemática , química , demografía , economía , geociencia , psicología matemática , probabilidad , sociología , ciencias políticas , lingüística , estadística y redes neuronales artificiales . Una generalización de la función logística es la función hyperbolastic de tipo I .

Historia

Imagen original de una curva logística, contrastada con una curva logarítmica

La función logística fue introducida en una serie de tres trabajos de Pierre François Verhulst entre 1838 y 1847, quien la ideó como un modelo de crecimiento poblacional ajustando el modelo de crecimiento exponencial , bajo la guía de Adolphe Quetelet . Verhulst ideó por primera vez la función a mediados de la década de 1830, publicando una breve nota en 1838, luego presentó un análisis ampliado y nombró la función en 1844 (publicado en 1845); el tercer artículo ajustó el término de corrección en su modelo de crecimiento de la población belga.

La etapa inicial de crecimiento es aproximadamente exponencial (geométrica); luego, a medida que comienza la saturación, el crecimiento se ralentiza a lineal (aritmética) y, en la madurez, el crecimiento se detiene. Verhulst no explicó la elección del término "logístico" (francés: logistique ), pero presumiblemente contrasta con la curva logarítmica y por analogía con la aritmética y la geometría. Su modelo de crecimiento está precedido por una discusión sobre el crecimiento aritmético y el crecimiento geométrico (cuya curva él llama una curva logarítmica , en lugar del término moderno curva exponencial ), y por lo tanto, "crecimiento logístico" es presumiblemente nombrado por analogía, siendo logístico del griego antiguo : λογῐστῐκός , romanizadologistikós , una división tradicional de las matemáticas griegas . El término no está relacionado con el término logística militar y de gestión , que en cambio es del francés : logis "alojamiento", aunque algunos creen que el término griego también influyó en la logística ; ver Logística § Origen para más detalles.

Propiedades matematicas

los función logística estándar es la función logística con parámetros,,, que produce

En la práctica, debido a la naturaleza de la función exponencial , a menudo es suficiente calcular la función logística estándar para un rango pequeño de números reales, como un rango contenido en [−6, +6], ya que rápidamente converge muy cerca de sus valores de saturación de 0 y 1.

La función logística tiene la propiedad de simetría que

Por tanto, es una función extraña .

La función logística es una función tangente hiperbólica escalada y compensada :

o

Esto se sigue de

Derivado

La función logística estándar tiene una derivada que se calcula fácilmente . La derivada se conoce como distribución logística :

Integral

Por el contrario, su antiderivada se puede calcular mediante la sustitución , ya que , entonces (descartando la constante de integración )

En las redes neuronales artificiales , esto se conoce como función softplus y (con escalamiento) es una aproximación suave de la función de rampa , al igual que la función logística (con escalamiento) es una aproximación suave de la función escalonada de Heaviside .

Ecuación diferencial logística

La función logística estándar es la solución de la ecuación diferencial ordinaria no lineal de primer orden simple

con condición de contorno . Esta ecuación es la versión continua del mapa logístico . Tenga en cuenta que la función logística recíproca es la solución de una ecuación diferencial ordinaria lineal simple de primer orden .

El comportamiento cualitativo se comprende fácilmente en términos de la línea de fase : la derivada es 0 cuando la función es 1; y la derivada es positiva para entre 0 y 1, y negativa para más de 1 o menos de 0 (aunque las poblaciones negativas generalmente no concuerdan con un modelo físico). Esto produce un equilibrio inestable en 0 y un equilibrio estable en 1 y, por lo tanto, para cualquier valor de función mayor que 0 y menor que 1, crece a 1.

La ecuación logística es un caso especial de la ecuación diferencial de Bernoulli y tiene la siguiente solución:

La elección de la constante de integración da la otra forma conocida de la definición de la curva logística:

Más cuantitativamente, como se puede ver en la solución analítica, la curva logística muestra un crecimiento exponencial temprano para un argumento negativo, que alcanza un crecimiento lineal de pendiente 1/4 para un argumento cercano a 0, luego se acerca a 1 con una brecha que decae exponencialmente.

La función logística es la inversa de la función logit natural y, por lo tanto, se puede usar para convertir el logaritmo de las probabilidades en una probabilidad . En notación matemática, la función logística a veces se escribe como expit, en la misma forma que logit . La conversión de la razón logarítmica de verosimilitud de dos alternativas también toma la forma de una curva logística.

La ecuación diferencial derivada anteriormente es un caso especial de una ecuación diferencial general que solo modela la función sigmoidea . En muchas aplicaciones de modelado, la forma más general

puede ser deseable. Su solución es el sigmoide desplazado y escalado .

La relación hiperbólico-tangente conduce a otra forma para la derivada de la función logística:

que vincula la función logística con la distribución logística .

Simetría rotacional sobre (0, 1/2)

La suma de la función logística y su reflexión sobre el eje vertical`` es

Por tanto, la función logística es rotacionalmente simétrica con respecto al punto (0, 1/2).

Aplicaciones

Link creó una extensión de la teoría del análisis secuencial de Wald a una acumulación libre de distribución de variables aleatorias hasta que primero se iguale o se exceda un límite positivo o negativo. Link deriva la probabilidad de igualar o exceder primero el límite positivo como , la función logística. Ésta es la primera prueba de que la función logística puede tener como base un proceso estocástico. Link proporciona un siglo de ejemplos de resultados experimentales "logísticos" y una relación recién derivada entre esta probabilidad y el tiempo de absorción en los límites.

En ecología: modelización del crecimiento de la población

Pierre-François Verhulst (1804-1849)

Una aplicación típica de la ecuación logística es un modelo común de crecimiento de la población (ver también dinámica de la población ), originalmente debido a Pierre-François Verhulst en 1838, donde la tasa de reproducción es proporcional tanto a la población existente como a la cantidad de recursos disponibles, en igualdad de condiciones. La ecuación Verhulst fue publicado después de Verhulst había leído Thomas Malthus " Ensayo sobre el principio de la población , que describe el modelo de crecimiento de Malthus de crecimiento exponencial sencilla (sin restricciones). Verhulst derivó su ecuación logística para describir el crecimiento autolimitado de una población biológica . La ecuación fue redescubierta en 1911 por AG McKendrick para el crecimiento de bacterias en caldo y probada experimentalmente usando una técnica para la estimación de parámetros no lineales. La ecuación a veces también se denomina ecuación de Verhulst-Pearl después de que Raymond Pearl (1879-1940) y Lowell Reed (1888-1966) de la Universidad Johns Hopkins la redescubrieron en 1920 . Otro científico, Alfred J. Lotka derivó la ecuación nuevamente en 1925, llamándola la ley del crecimiento de la población .

Dejando representar el tamaño de la población ( se usa a menudo en ecología) y representar el tiempo, este modelo se formaliza mediante la ecuación diferencial :

donde la constante define la tasa de crecimiento y es la capacidad de carga .

En la ecuación, el primer término modela la tasa de crecimiento inicial sin obstáculos . El valor de la tasa representa el aumento proporcional de la población en una unidad de tiempo. Más tarde, a medida que la población crece, el módulo del segundo término (que multiplicado es ) se vuelve casi tan grande como el primero, ya que algunos miembros de la población interfieren entre sí al competir por algún recurso crítico, como alimentos o espacio vital. . Este efecto antagónico se denomina cuello de botella y está modelado por el valor del parámetro . La competencia disminuye la tasa de crecimiento combinada, hasta que el valor de deja de crecer (esto se llama madurez de la población). La solución a la ecuación ( siendo la población inicial) es

dónde

Es decir, ese es el valor límite de : el valor más alto que la población puede alcanzar en un tiempo infinito (o estar cerca de alcanzarlo en un tiempo finito). Es importante destacar que la capacidad de carga se alcanza asintóticamente independientemente del valor inicial , y también en el caso de que .

En ecología, especies se denominan a veces -strategist o -strategist dependiendo de los selectivos procesos que han dado forma a sus historias de vida estrategias. La elección de las dimensiones variables de modo que mida la población en unidades de capacidad de carga y mida el tiempo en unidades de da la ecuación diferencial adimensional

Capacidad de carga variable en el tiempo

Dado que las condiciones ambientales influyen en la capacidad de carga, como consecuencia, puede variar en el tiempo , lo que conduce al siguiente modelo matemático:

Un caso particularmente importante es el de la capacidad de carga que varía periódicamente con el período :

Se puede demostrar que en tal caso, independientemente del valor inicial , tenderá a una única solución periódica , cuyo período es .

Un valor típico de es un año: en tal caso, puede reflejar variaciones periódicas de las condiciones climáticas.

Otra generalización interesante es considerar que la capacidad de carga es una función de la población en un momento anterior, capturando un retraso en la forma en que la población modifica su entorno. Esto conduce a una ecuación de retardo logístico, que tiene un comportamiento muy rico, con biestabilidad en algún rango de parámetros, así como un decaimiento monotónico a cero, crecimiento exponencial suave, crecimiento ilimitado puntuado (es decir, múltiples formas S), crecimiento puntuado o alternancia a un nivel estacionario, aproximación oscilatoria a un nivel estacionario, oscilaciones sostenibles, singularidades de tiempo finito y muerte en tiempo finito.

En estadística y aprendizaje automático

Las funciones logísticas se utilizan en varios roles en estadística. Por ejemplo, son la función de distribución acumulativa de la familia logística de distribuciones y, un poco simplificadas, se utilizan para modelar la posibilidad que tiene un jugador de ajedrez de vencer a su oponente en el sistema de clasificación Elo . A continuación se muestran ejemplos más específicos.

Regresión logística

Las funciones logísticas se utilizan en regresión logística para modelar cómo la probabilidad de un evento puede verse afectada por una o más variables explicativas : un ejemplo sería tener el modelo

donde es la variable explicativa, y son los parámetros del modelo que deben ajustarse, y es la función logística estándar.

La regresión logística y otros modelos log-lineales también se usan comúnmente en el aprendizaje automático . Una generalización de la función logística a múltiples entradas es la función de activación softmax , utilizada en la regresión logística multinomial .

Otra aplicación de la función logística se encuentra en el modelo de Rasch , utilizado en la teoría de respuesta al ítem . En particular, el modelo de Rasch forma una base para la estimación de máxima verosimilitud de las ubicaciones de objetos o personas en un continuo , basado en colecciones de datos categóricos, por ejemplo, las habilidades de las personas en un continuo basado en respuestas que han sido categorizadas como correctas y incorrecto.

Redes neuronales

Las funciones logísticas se utilizan a menudo en redes neuronales para introducir no linealidad en el modelo o para sujetar señales dentro de un intervalo especificado . Un elemento de red neuronal popular calcula una combinación lineal de sus señales de entrada y aplica una función logística limitada como función de activación al resultado; este modelo puede verse como una variante "suavizada" de la neurona umbral clásica .

Una opción común para las funciones de activación o "aplastamiento", que se utiliza para recortar grandes magnitudes para mantener la respuesta de la red neuronal limitada es

que es una función logística.

Estas relaciones dan como resultado implementaciones simplificadas de redes neuronales artificiales con neuronas artificiales . Los médicos advierten que las funciones sigmoidales que son antisimétricas con respecto al origen (por ejemplo, la tangente hiperbólica ) conducen a una convergencia más rápida cuando se entrenan redes con retropropagación .

La función logística es en sí misma la derivada de otra función de activación propuesta, el softplus .

En medicina: modelado del crecimiento de tumores

Otra aplicación de la curva logística es en medicina, donde la ecuación diferencial logística se usa para modelar el crecimiento de tumores. Esta aplicación puede considerarse una extensión del uso mencionado anteriormente en el marco de la ecología (ver también la curva logística generalizada , que permite más parámetros). Denotando con el tamaño del tumor en ese momento , su dinámica se rige por

que es del tipo

donde es la tasa de proliferación del tumor.

Si se inicia una quimioterapia con un efecto log-kill, la ecuación puede revisarse para ser

donde es la tasa de mortalidad inducida por la terapia. En el caso idealizado de una terapia muy larga, puede modelarse como una función periódica (de período ) o (en el caso de la terapia de infusión continua) como una función constante, y uno tiene que

es decir, si la tasa de muerte media inducida por la terapia es mayor que la tasa de proliferación inicial, entonces existe la erradicación de la enfermedad. Por supuesto, este es un modelo demasiado simplificado tanto del crecimiento como de la terapia (por ejemplo, no tiene en cuenta el fenómeno de la resistencia clonal).

En medicina: modelado de una pandemia

Un nuevo patógeno infeccioso al que una población no tiene inmunidad generalmente se propagará exponencialmente en las primeras etapas, mientras que el suministro de individuos susceptibles es abundante. El virus SARS-CoV-2 que causa COVID-19 exhibió un crecimiento exponencial temprano en el curso de la infección en varios países a principios de 2020. Muchos factores, que van desde la falta de susceptibles (ya sea a través de la propagación continua de la infección hasta que supera el umbral de inmunidad colectiva o reducción en la accesibilidad de los susceptibles a través de medidas de distanciamiento físico), las curvas epidémicas de aspecto exponencial pueden primero linealizarse (replicando la transición "logarítmica" a "logística" señalada por primera vez por Pierre-François Verhulst , como se señaló anteriormente) y luego alcanzar una límite máximo.

Una función logística o funciones relacionadas (por ejemplo, la función de Gompertz ) se utilizan generalmente de manera descriptiva o fenomenológica porque se ajustan bien no solo al aumento exponencial temprano, sino a la eventual nivelación de la pandemia a medida que la población desarrolla una inmunidad colectiva. . Esto contrasta con los modelos reales de pandemias que intentan formular una descripción basada en la dinámica de la pandemia (por ejemplo, tasas de contacto, tiempos de incubación, distanciamiento social, etc.). Sin embargo, se han desarrollado algunos modelos simples que dan una solución logística.

Modelado de la trayectoria de la infección por COVID-19

Función logística generalizada (curva de crecimiento de Richards) en modelos epidemiológicos

Una función logística generalizada , también llamada curva de crecimiento de Richards, se usa ampliamente para modelar las trayectorias de infección por COVID-19 . La trayectoria de la infección es un dato de serie de tiempo diario para el número acumulado de casos infectados para un sujeto como país, ciudad, estado, etc.

donde son números reales y es un número real positivo. La flexibilidad de la curva se debe al parámetro : (i) si entonces la curva se reduce a la función logística, y (ii) si converge a cero, entonces la curva converge a la función de Gompertz . En el modelado epidemiológico, , , y representar el tamaño epidemia final, tasa de infección, y retardo de fase, respectivamente. Consulte el panel de la derecha para ver una trayectoria de infección ejemplar cuando están designados por .

Trayectorias de infección extrapoladas de 40 países gravemente afectados por COVID-19 y gran promedio (población) hasta el 14 de mayo

Uno de los beneficios de utilizar la función de crecimiento como la función logística generalizada en el modelado epidemiológico es su expansión relativamente fácil al marco del modelo multinivel mediante el uso de la función de crecimiento para describir las trayectorias de infección de múltiples sujetos (países, ciudades, estados, etc.). Dicho marco de modelado también se puede denominar ampliamente modelo de efectos mixtos no lineal o modelo no lineal jerárquico. Vea la figura de arriba. Un ejemplo del uso de la función logística generalizada en el modelo multinivel bayesiano es el modelo de Richards jerárquico bayesiano .

En química: modelos de reacción

La concentración de reactivos y productos en reacciones autocatalíticas sigue la función logística. La degradación del catalizador de la reacción de reducción de oxígeno (ORR) sin metales del grupo del platino (sin PGM) en los cátodos de las pilas de combustible sigue la función de descomposición logística, lo que sugiere un mecanismo de degradación autocatalítico.

En física: distribución de Fermi-Dirac

La función logística determina la distribución estadística de los fermiones sobre los estados energéticos de un sistema en equilibrio térmico. En particular, es la distribución de las probabilidades de que cada nivel de energía posible esté ocupado por un fermión, según las estadísticas de Fermi-Dirac .

En ciencia de materiales: diagramas de fase

Consulte Unión por difusión .

En lingüística: cambio de idioma

En lingüística, la función logística se puede utilizar para modelar el cambio de lenguaje : una innovación que al principio es marginal comienza a extenderse más rápidamente con el tiempo y luego más lentamente a medida que se adopta de manera más universal.

En agricultura: modelización de la respuesta de los cultivos

La curva S logística se puede utilizar para modelar la respuesta del cultivo a los cambios en los factores de crecimiento. Hay dos tipos de funciones de respuesta: curvas de crecimiento positivas y negativas . Por ejemplo, el rendimiento del cultivo puede aumentar al aumentar el valor del factor de crecimiento hasta un cierto nivel (función positiva), o puede disminuir al aumentar los valores del factor de crecimiento (función negativa debido a un factor de crecimiento negativo), situación que requiere una inversión S curva.

Modelo de curva en S para el rendimiento del cultivo frente a la profundidad del nivel freático .
Modelo de curva en S invertida para rendimiento de cultivos versus salinidad del suelo .

En economía y sociología: difusión de innovaciones

La función logística se puede utilizar para ilustrar el progreso de la difusión de una innovación a lo largo de su ciclo de vida.

En Las leyes de la imitación (1890), Gabriel Tarde describe el surgimiento y difusión de nuevas ideas a través de cadenas imitativas. En particular, Tarde identifica tres etapas principales a través de las cuales se difunden las innovaciones: la primera corresponde a los comienzos difíciles, durante los cuales la idea debe luchar en un entorno hostil lleno de hábitos y creencias opuestas; el segundo corresponde al despegue propiamente exponencial de la idea, con ; finalmente, la tercera etapa es logarítmica, con y corresponde al momento en que el impulso de la idea se ralentiza gradualmente mientras aparecen simultáneamente nuevas ideas oponentes. La situación resultante frena o estabiliza el avance de la innovación, que se acerca a una asíntota.

En un estado soberano , las unidades subnacionales ( estados constituyentes o ciudades) pueden utilizar préstamos para financiar sus proyectos. Sin embargo, esta fuente de financiación suele estar sujeta a estrictas normas legales, así como a las limitaciones de la escasez de la economía , especialmente los recursos que los bancos pueden prestar (debido a su capital social o límites de Basilea ). Estas restricciones, que representan un nivel de saturación, junto con una carrera exponencial en una competencia económica por el dinero, crean una difusión de las solicitudes de crédito en las finanzas públicas y la respuesta nacional agregada es una curva sigmoidea .

En la historia de la economía, cuando se introducen nuevos productos hay una intensa cantidad de investigación y desarrollo que conduce a mejoras dramáticas en la calidad y reducciones en los costos. Esto conduce a un período de rápido crecimiento de la industria. Algunos de los ejemplos más famosos son: ferrocarriles, bombillas incandescentes, electrificación , automóviles y viajes en avión. Eventualmente, se agotan las oportunidades de mejora dramática y reducción de costos, el producto o proceso se usa ampliamente con pocos clientes potenciales restantes y los mercados se saturan.

El análisis logístico fue utilizado en artículos por varios investigadores del Instituto Internacional de Análisis de Sistemas Aplicados ( IIASA ). Estos trabajos abordan la difusión de diversas innovaciones, infraestructuras y sustituciones de fuentes de energía y el papel del trabajo en la economía, así como en el largo ciclo económico. Robert Ayres (1989) investigó los ciclos económicos prolongados. Cesare Marchetti publicó sobre largos ciclos económicos y sobre difusión de innovaciones. El libro de Arnulf Grübler (1990) da una descripción detallada de la difusión de las infraestructuras que incluyen canales, ferrocarriles, carreteras y aerolíneas, mostrando que su difusión siguió curvas de forma logística.

Carlota Pérez utilizó una curva logística para ilustrar el ciclo económico largo ( Kondratiev ) con las siguientes etiquetas: inicio de una era tecnológica como irrupción , el ascenso como frenesí , la rápida construcción como sinergia y la finalización como madurez .

Ver también

Notas

Referencias

enlaces externos