Análisis predictivo - Predictive analytics

El análisis predictivo abarca una variedad de técnicas estadísticas desde la minería de datos , el modelado predictivo y el aprendizaje automático que analizan hechos actuales e históricos para hacer predicciones sobre eventos futuros o desconocidos.

En los negocios, los modelos predictivos aprovechan los patrones que se encuentran en los datos históricos y transaccionales para identificar riesgos y oportunidades. Los modelos capturan relaciones entre muchos factores para permitir la evaluación del riesgo o potencial asociado con un conjunto particular de condiciones, guiando la toma de decisiones para transacciones candidatas.

El efecto funcional definitorio de estos enfoques técnicos es que el análisis predictivo proporciona una puntuación predictiva (probabilidad) para cada individuo (cliente, empleado, paciente sanitario, SKU de producto, vehículo, componente, máquina u otra unidad organizativa) con el fin de determinar, informar , o influir en los procesos organizacionales que pertenecen a un gran número de personas, como en marketing, evaluación de riesgo crediticio, detección de fraude, fabricación, atención médica y operaciones gubernamentales, incluida la aplicación de la ley.

El análisis predictivo se utiliza en ciencia actuarial , marketing , gestión empresarial , deportes / deportes de fantasía , seguros , vigilancia , telecomunicaciones , comercio minorista , viajes , movilidad , atención médica , protección infantil , productos farmacéuticos , planificación de capacidades , redes sociales y otros campos.

Una de las aplicaciones más conocidas es la calificación crediticia , que se utiliza en toda la gestión empresarial . Los modelos de puntuación procesan el historial crediticio de un cliente , la solicitud de préstamo , los datos del cliente, etc., con el fin de clasificar a las personas según su probabilidad de realizar pagos de crédito futuros a tiempo.

Definición

El análisis predictivo es un área de las estadísticas que se ocupa de extraer información de los datos y usarla para predecir tendencias y patrones de comportamiento. La mejora de la analítica web predictiva calcula las probabilidades estadísticas de eventos futuros en línea. Las técnicas estadísticas de análisis predictivo incluyen modelado de datos , aprendizaje automático , inteligencia artificial , algoritmos de aprendizaje profundo y minería de datos . A menudo, el evento desconocido de interés está en el futuro, pero la analítica predictiva se puede aplicar a cualquier tipo de evento desconocido, ya sea en el pasado, presente o futuro. Por ejemplo, identificar a los sospechosos después de que se ha cometido un delito o fraude con tarjetas de crédito cuando se produce. El núcleo del análisis predictivo se basa en capturar las relaciones entre las variables explicativas y las variables predichas de sucesos pasados, y explotarlas para predecir el resultado desconocido. Sin embargo, es importante señalar que la precisión y usabilidad de los resultados dependerá en gran medida del nivel de análisis de datos y la calidad de los supuestos.

La analítica predictiva a menudo se define como la predicción a un nivel más detallado de granularidad, es decir, la generación de puntuaciones predictivas (probabilidades) para cada elemento organizativo individual. Esto lo distingue de la previsión . Por ejemplo, "Análisis predictivo: tecnología que aprende de la experiencia (datos) para predecir el comportamiento futuro de las personas a fin de tomar mejores decisiones". En los sistemas industriales del futuro, el valor de la analítica predictiva será predecir y prevenir problemas potenciales para lograr una ruptura cercana a cero e integrarse aún más en la analítica prescriptiva para la optimización de decisiones.

Tipos

Generalmente, el término análisis predictivo se utiliza para referirse a modelos predictivos , "puntuación" de datos con modelos predictivos y pronósticos . Sin embargo, la gente usa cada vez más el término para referirse a disciplinas analíticas relacionadas, como el modelado descriptivo y el modelado u optimización de decisiones. Estas disciplinas también implican un análisis de datos riguroso y se utilizan ampliamente en los negocios para la segmentación y la toma de decisiones, pero tienen diferentes propósitos y las técnicas estadísticas subyacentes varían.

Modelos predictivos

El modelado predictivo utiliza modelos predictivos para analizar la relación entre el rendimiento específico de una unidad en una muestra y uno o más atributos o características conocidos de esa unidad. El objetivo del modelo es evaluar la probabilidad de que una unidad similar en una muestra diferente exhiba el desempeño específico. Esta categoría abarca modelos en muchas áreas, como marketing, donde buscan patrones de datos sutiles para responder preguntas sobre el desempeño del cliente o modelos de detección de fraude. Los modelos predictivos a menudo realizan cálculos durante transacciones en vivo, por ejemplo, para evaluar el riesgo o la oportunidad de un cliente o transacción determinados, con el fin de guiar una decisión. Con los avances en la velocidad de la computación, los sistemas de modelado de agentes individuales se han vuelto capaces de simular el comportamiento o las reacciones humanas a determinados estímulos o escenarios.

Las unidades de muestra disponibles con atributos y desempeños conocidos se denominan "muestra de entrenamiento". Las unidades de otras muestras, con atributos conocidos pero desempeños desconocidos, se denominan unidades "fuera de muestra [de entrenamiento]". Las unidades fuera de la muestra no tienen necesariamente una relación cronológica con las unidades de la muestra de entrenamiento. Por ejemplo, la muestra de formación puede consistir en atributos literarios de escritos de autores victorianos, con atribución conocida, y la unidad fuera de muestra puede ser una escritura recién encontrada con autoría desconocida; un modelo predictivo puede ayudar a atribuir un trabajo a un autor conocido. Otro ejemplo lo da el análisis de salpicaduras de sangre en escenas de crimen simuladas en las que la unidad fuera de muestra es el patrón de salpicaduras de sangre real de la escena de un crimen. La unidad fuera de muestra puede ser del mismo tiempo que las unidades de entrenamiento, de un tiempo anterior o de un tiempo futuro.

Modelos descriptivos

Los modelos descriptivos cuantifican las relaciones en los datos de una manera que se usa a menudo para clasificar a los clientes o prospectos en grupos. A diferencia de los modelos predictivos que se centran en predecir el comportamiento de un solo cliente (como el riesgo crediticio), los modelos descriptivos identifican muchas relaciones diferentes entre clientes o productos. Los modelos descriptivos no clasifican a los clientes por su probabilidad de realizar una acción en particular como lo hacen los modelos predictivos. En su lugar, se pueden utilizar modelos descriptivos, por ejemplo, para clasificar a los clientes según sus preferencias de productos y su etapa de vida. Se pueden utilizar herramientas de modelado descriptivo para desarrollar más modelos que puedan simular un gran número de agentes individualizados y hacer predicciones.

Modelos de decisión

Los modelos de decisión describen la relación entre todos los elementos de una decisión — los datos conocidos (incluidos los resultados de los modelos predictivos), la decisión y los resultados de pronóstico de la decisión — para predecir los resultados de decisiones que involucran muchas variables. Estos modelos se pueden utilizar en la optimización, maximizando ciertos resultados y minimizando otros. Los modelos de decisión se utilizan generalmente para desarrollar la lógica de decisión o un conjunto de reglas comerciales que producirán la acción deseada para cada cliente o circunstancia.

Aplicaciones

Aunque el análisis predictivo se puede utilizar en muchas aplicaciones, describimos algunos ejemplos en los que el análisis predictivo ha mostrado un impacto positivo en los últimos años.

Negocio

La gestión analítica de relaciones con el cliente (CRM) es una aplicación comercial frecuente del análisis predictivo. Los métodos de análisis predictivo se aplican a los datos del cliente para construir una visión holística del cliente. CRM utiliza el análisis predictivo en aplicaciones para campañas de marketing, ventas y servicios al cliente. El CRM analítico se puede aplicar a lo largo del ciclo de vida de los clientes ( adquisición , crecimiento de la relación , retención y recuperación).

A menudo, las organizaciones corporativas recopilan y mantienen abundante información, como registros de clientes o transacciones de venta. En estos casos, el análisis predictivo puede ayudar a analizar el gasto, el uso y otros comportamientos de los clientes, lo que conduce a ventas cruzadas eficientes o la venta de productos adicionales a los clientes actuales.

La aplicación adecuada de análisis predictivos puede conducir a estrategias de retención más proactivas y efectivas. Mediante un examen frecuente del uso anterior del servicio, el rendimiento del servicio, el gasto y otros patrones de comportamiento de un cliente, los modelos predictivos pueden determinar la probabilidad de que un cliente cancele el servicio pronto. Una intervención con ofertas de alto valor percibido puede aumentar las posibilidades de convertir o retener al cliente. El análisis predictivo también puede predecir el desgaste silencioso, el comportamiento de un cliente para reducir el uso de manera lenta pero constante.

Protección infantil

Algunas agencias de bienestar infantil han comenzado a utilizar análisis predictivos para señalar casos de alto riesgo. Por ejemplo, en el condado de Hillsborough, Florida , el uso de una herramienta de modelado predictivo por parte de la agencia de bienestar infantil ha evitado las muertes infantiles relacionadas con el abuso en la población objetivo.

Sistemas de apoyo a la decisión clínica

El análisis predictivo se ha utilizado en la atención médica principalmente para determinar qué pacientes están en riesgo de desarrollar afecciones como diabetes, asma o enfermedades cardíacas. Además, los sofisticados sistemas de apoyo a las decisiones clínicas incorporan análisis predictivos para respaldar la toma de decisiones médicas.

Un estudio de 2016 sobre trastornos neurodegenerativos proporciona un poderoso ejemplo de una plataforma CDS para diagnosticar, rastrear, predecir y monitorear la progresión de la enfermedad de Parkinson .

Predecir los resultados de las decisiones legales

Los programas de IA pueden predecir el resultado de las decisiones jurídicas . Estos programas se pueden utilizar como herramientas de asistencia para las profesiones de esta industria.

Predicción a nivel de cartera, producto o economía

A menudo, el enfoque del análisis no es el consumidor, sino el producto, la cartera, la empresa, la industria o incluso la economía. Por ejemplo, un minorista podría estar interesado en predecir la demanda a nivel de tienda para fines de gestión de inventario. O la Junta de la Reserva Federal podría estar interesada en predecir la tasa de desempleo para el próximo año. Estos tipos de problemas se pueden abordar mediante análisis predictivos utilizando técnicas de series de tiempo (ver más abajo). También se pueden abordar a través de enfoques de aprendizaje automático que transforman la serie de tiempo original en un espacio vectorial de características, donde el algoritmo de aprendizaje encuentra patrones que tienen poder predictivo.

Suscripción

Muchas empresas deben tener en cuenta la exposición al riesgo debido a sus diferentes servicios y determinar los costos necesarios para cubrir el riesgo. El análisis predictivo puede ayudar a respaldar estas cantidades al predecir las posibilidades de enfermedad, incumplimiento , quiebra , etc. El análisis predictivo puede agilizar el proceso de adquisición de clientes al predecir el comportamiento de riesgo futuro de un cliente utilizando datos de nivel de aplicación. El análisis predictivo en forma de puntajes crediticios ha reducido la cantidad de tiempo que lleva la aprobación de préstamos, especialmente en el mercado hipotecario. Un análisis predictivo adecuado puede conducir a decisiones de precios adecuadas, lo que puede ayudar a mitigar el riesgo futuro de incumplimiento.

Influencias de la tecnología y el big data

Big Data es una colección de conjuntos de datos que son tan grandes y complejos que resulta difícil trabajar con ellos utilizando herramientas tradicionales de administración de bases de datos . El volumen, la variedad y la velocidad de los macrodatos han presentado desafíos en todos los ámbitos para la captura, el almacenamiento, la búsqueda, el intercambio, el análisis y la visualización. Ejemplos de fuentes de big data incluyen registros web , RFID , datos de sensores , redes sociales , indexación de búsqueda en Internet, registros de detalles de llamadas, vigilancia militar y datos complejos en ciencias astronómicas, biogeoquímicas, genómicas y atmosféricas. Big Data es el núcleo de la mayoría de los servicios analíticos predictivos que ofrecen las organizaciones de TI. Gracias a los avances tecnológicos en hardware informático (CPU más rápidas, memoria más barata y arquitecturas MPP) y nuevas tecnologías como Hadoop , MapReduce y análisis de texto y en la base de datos para procesar macrodatos, ahora es factible recopilar, analizar y extraer cantidades masivas de datos estructurados y no estructurados para obtener nuevos conocimientos. También es posible ejecutar algoritmos predictivos en transmisión de datos. Hoy en día, la exploración de macrodatos y el uso de análisis predictivos está al alcance de más organizaciones que nunca y se proponen nuevos métodos que son capaces de manejar dichos conjuntos de datos.

Técnicas analíticas

Los enfoques y técnicas utilizados para realizar análisis predictivos pueden agruparse en términos generales en técnicas de regresión y técnicas de aprendizaje automático.

Técnicas de regresión

Los modelos de regresión son el pilar de la analítica predictiva. El enfoque radica en establecer una ecuación matemática como modelo para representar las interacciones entre las diferentes variables en consideración. Dependiendo de la situación, existe una amplia variedad de modelos que se pueden aplicar mientras se realizan análisis predictivos. Algunos de ellos se analizan brevemente a continuación.

Modelo de regresión lineal

El modelo de regresión lineal predice la variable de respuesta como una función lineal de los parámetros con coeficientes desconocidos. Estos parámetros se ajustan para optimizar una medida de ajuste. Gran parte del esfuerzo en el ajuste del modelo se centra en minimizar el tamaño del residuo, así como en asegurar que se distribuya aleatoriamente con respecto a las predicciones del modelo.

El objetivo de la regresión es seleccionar los parámetros del modelo para minimizar la suma de los residuos al cuadrado. Esto se conoce como estimación por mínimos cuadrados ordinarios (MCO).

Modelos de elección discreta

La regresión múltiple (arriba) se usa generalmente cuando la variable de respuesta es continua y tiene un rango ilimitado. A menudo, la variable de respuesta puede no ser continua sino más bien discreta. Si bien matemáticamente es factible aplicar la regresión múltiple a variables dependientes ordenadas discretas, algunas de las suposiciones detrás de la teoría de la regresión lineal múltiple ya no son válidas y existen otras técnicas, como los modelos de elección discreta, que son más adecuadas para este tipo de análisis. Si la variable dependiente es discreta, algunos de esos métodos superiores son modelos de regresión logística , logit multinomial y probit . Los modelos de regresión logística y probit se utilizan cuando la variable dependiente es binaria .

Regresión logística

En un entorno de clasificación, la asignación de probabilidades de resultado a las observaciones se puede lograr mediante el uso de un modelo logístico (también llamado modelo lógico), que transforma la información sobre la variable dependiente binaria en una variable continua ilimitada y estima un modelo multivariado regular.

La prueba de Wald y la razón de verosimilitud se utilizan para probar la significancia estadística de cada coeficiente b en el modelo (análoga a las pruebas t utilizadas en la regresión OLS; ver más arriba). Una prueba que evalúa la bondad de ajuste de un modelo de clasificación es el "porcentaje predicho correctamente".

Regresión probit

Los modelos probit ofrecen una alternativa a la regresión logística para modelar variables dependientes categóricas.

Regresión logística multinomial

Una extensión del modelo logit binario a los casos en los que la variable dependiente tiene más de 2 categorías es el modelo logit multinomial . En tales casos, el colapso de los datos en dos categorías puede no tener sentido o puede conducir a una pérdida en la riqueza de los datos. El modelo logit multinomial es la técnica adecuada en estos casos, especialmente cuando las categorías de variables dependientes no están ordenadas (por ejemplo, colores como rojo, azul, verde). Algunos autores han ampliado la regresión multinomial para incluir métodos de selección / importancia de características, como el logit multinomial aleatorio .

Logit versus probit

Las dos regresiones tienden a comportarse de manera similar, excepto que la distribución logística tiende a tener una cola ligeramente más plana. Los coeficientes obtenidos del modelo logit y probit suelen estar muy próximos. Sin embargo, la razón de posibilidades es más fácil de interpretar en el modelo logit.

Las razones prácticas para elegir el modelo probit en lugar del modelo logístico podrían incluir:

  • Existe una fuerte creencia de que la distribución subyacente es normal.
  • El evento real no es un resultado binario ( p . Ej. , Estado de quiebra) sino una proporción ( p . Ej. , Proporción de la población con diferentes niveles de deuda).

Modelos de series de tiempo

Los modelos de series de tiempo se utilizan para predecir o pronosticar el comportamiento futuro de las variables. Estos modelos tienen en cuenta el hecho de que los puntos de datos tomados a lo largo del tiempo pueden tener una estructura interna (como autocorrelación, tendencia o variación estacional) que debe tenerse en cuenta. Como resultado, las técnicas de regresión estándar no se pueden aplicar a los datos de series de tiempo y se ha desarrollado una metodología para descomponer el componente tendencial, estacional y cíclico de la serie.

Los modelos de series de tiempo estiman ecuaciones en diferencias que contienen componentes estocásticos. Dos formas comúnmente utilizadas de estos modelos son los modelos autorregresivos (AR) y los modelos de media móvil (MA). La metodología de Box-Jenkins combina los modelos AR y MA para producir el modelo ARMA (media móvil autorregresiva), que es la piedra angular del análisis de series de tiempo estacionarias. ARIMA (modelos de media móvil integrados autorregresivos), por otro lado, se utilizan para describir series de tiempo no estacionarias.

En los últimos años, los modelos de series de tiempo se han vuelto más sofisticados e intentan modelar la heterocedasticidad condicional. Dichos modelos incluyen el modelo ARCH ( heterocedasticidad condicional autorregresiva ) y el modelo GARCH (heterocedasticidad condicional autorregresiva generalizada), ambos utilizados frecuentemente para series de tiempo financieras.

Análisis de supervivencia o duración

El análisis de supervivencia es otro nombre para el análisis del tiempo transcurrido hasta el evento. Estas técnicas se desarrollaron principalmente en las ciencias médicas y biológicas, pero también se utilizan ampliamente en las ciencias sociales como la economía, así como en la ingeniería.

La censura y la no normalidad, características de los datos de supervivencia, generan dificultad al intentar analizar los datos utilizando modelos estadísticos convencionales como la regresión lineal múltiple . La distribución normal , al ser una distribución simétrica, toma valores tanto positivos como negativos, pero la duración por su propia naturaleza no puede ser negativa y, por lo tanto, no se puede asumir la normalidad cuando se trata de datos de duración / supervivencia.

Los modelos de duración pueden ser paramétricos, no paramétricos o semiparamétricos. Algunos de los modelos comúnmente utilizados son el modelo de riesgo proporcional de Kaplan-Meier y Cox (no paramétrico).

Árboles de clasificación y regresión (CART)

Los árboles de clasificación y regresión (CART) son una técnica de aprendizaje de árboles de decisión no paramétrica que produce árboles de clasificación o regresión, dependiendo de si la variable dependiente es categórica o numérica, respectivamente.

Los árboles de decisión están formados por una colección de reglas basadas en variables en el conjunto de datos de modelado:

  • Las reglas basadas en los valores de las variables se seleccionan para obtener la mejor división para diferenciar las observaciones basadas en la variable dependiente.
  • Una vez que se selecciona una regla y se divide un nodo en dos, se aplica el mismo proceso a cada nodo "secundario" (es decir, es un procedimiento recursivo)
  • La división se detiene cuando CART detecta que no se puede hacer más ganancia o se cumplen algunas reglas de parada preestablecidas. (Alternativamente, los datos se dividen tanto como sea posible y luego se poda el árbol ).

Cada rama del árbol termina en un nodo terminal. Cada observación cae en uno y exactamente un nodo terminal, y cada nodo terminal está definido de forma única por un conjunto de reglas.

Un método muy popular para el análisis predictivo son los bosques aleatorios .

Splines de regresión adaptativa multivariante

Las splines de regresión adaptativa multivariante (MARS) es una técnica no paramétrica que crea modelos flexibles ajustando regresiones lineales por partes .

El enfoque de spline de regresión adaptativa y multivariante sobreajusta deliberadamente el modelo y luego lo poda para llegar al modelo óptimo. El algoritmo es computacionalmente muy intensivo y, en la práctica, se especifica un límite superior en el número de funciones básicas.

Técnicas de aprendizaje automático

El aprendizaje automático incluye una serie de métodos estadísticos avanzados para regresión y clasificación, y encuentra aplicación en una amplia variedad de campos, incluidos diagnósticos médicos , detección de fraudes con tarjetas de crédito , reconocimiento facial y de voz y análisis del mercado de valores .

Instrumentos

Históricamente, el uso de herramientas de análisis predictivo, así como la comprensión de los resultados que ofrecían, requería habilidades avanzadas. Sin embargo, las herramientas modernas de análisis predictivo ya no están restringidas a los especialistas en TI. A medida que más organizaciones adoptan el análisis predictivo en los procesos de toma de decisiones y lo integran en sus operaciones, están creando un cambio en el mercado hacia los usuarios comerciales como los principales consumidores de la información. Los usuarios comerciales quieren herramientas que puedan usar por sí mismos. Los proveedores están respondiendo creando un nuevo software que elimina la complejidad matemática, proporciona interfaces gráficas fáciles de usar y / o incorpora atajos que pueden, por ejemplo, reconocer el tipo de datos disponibles y sugerir un modelo predictivo apropiado. Las herramientas de análisis predictivo se han vuelto lo suficientemente sofisticadas como para presentar y analizar adecuadamente los problemas de datos, de modo que cualquier trabajador de la información con conocimientos de datos pueda utilizarlas para analizar datos y recuperar resultados significativos y útiles. Por ejemplo, las herramientas modernas presentan hallazgos utilizando tablas, gráficos y puntajes simples que indican la probabilidad de posibles resultados.

Existen numerosas herramientas disponibles en el mercado que ayudan con la ejecución de análisis predictivos. Estos van desde aquellos que necesitan muy poca sofisticación para el usuario hasta aquellos que están diseñados para el practicante experto. La diferencia entre estas herramientas suele estar en el nivel de personalización y el levantamiento de datos pesado permitido.

PMML

El Predictive Model Markup Language (PMML) se propuso como lenguaje estándar para expresar modelos predictivos. Este lenguaje basado en XML proporciona una forma para que las diferentes herramientas definan modelos predictivos y los compartan. PMML 4.0 fue lanzado en junio de 2009.

Crítica

Hay muchos escépticos en lo que respecta a las habilidades de las computadoras y los algoritmos para predecir el futuro, incluido Gary King , profesor de la Universidad de Harvard y director del Instituto de Ciencias Sociales Cuantitativas. Las personas están influenciadas por su entorno de innumerables formas. Para predecir perfectamente lo que hará la gente a continuación, es necesario conocer y medir con precisión todas las variables influyentes. "Los entornos de las personas cambian aún más rápido que ellos mismos. Todo, desde el clima hasta la relación con su madre, puede cambiar la forma en que las personas piensan y actúan. Todas esas variables son impredecibles. Cómo afectarán a una persona es aún menos predecible. Si si se ponen en la misma situación exacta mañana, pueden tomar una decisión completamente diferente. Esto significa que una predicción estadística solo es válida en condiciones de laboratorio estériles, lo que de repente no es tan útil como parecía antes ".

En un estudio de 1072 artículos publicados en Information Systems Research y MIS Quarterly entre 1990 y 2006, solo 52 artículos empíricos intentaron afirmaciones predictivas, de los cuales solo 7 llevaron a cabo pruebas o modelos predictivos adecuados.

Ver también

Referencias

Otras lecturas

  • Agresti, Alan (2002). Análisis de datos categóricos . Hoboken: John Wiley and Sons. ISBN 0-471-36093-7.
  • Coggeshall, Stephen, Davies, John, Jones, Roger. y Schutzer, Daniel, "Intelligent Security Systems", en Freedman, Roy S., Flein, Robert A. y Lederman, Jess, Editors (1995). Inteligencia artificial en los mercados de capitales . Chicago: Irwin. ISBN 1-55738-811-3.CS1 maint: varios nombres: lista de autores ( enlace )
  • L. Devroye; L. Györfi; G. Lugosi (1996). Una teoría probabilística del reconocimiento de patrones . Nueva York: Springer-Verlag. ISBN 9781461207115.
  • Enders, Walter (2004). Econometría aplicada de series de tiempo . Hoboken: John Wiley and Sons. ISBN 0-521-83919-X.
  • Greene, William (2012). Análisis econométrico, 7ª ed . Londres: Prentice Hall. ISBN 978-0-13-139538-1.
  • Guidère, Mathieu; Howard N, Sh. Argamon (2009). Análisis de lenguaje enriquecido para el contraterrorismo . Berlín, Londres, Nueva York: Springer-Verlag. ISBN 978-3-642-01140-5.
  • Mitchell, Tom (1997). Aprendizaje automático . Nueva York: McGraw-Hill. ISBN 0-07-042807-7.
  • Siegel, Eric (2016). Análisis predictivo: el poder de predecir quién hará clic, comprará, mentirá o morirá . John Wiley. ISBN 978-1119145677.
  • Tukey, John (1977). Análisis de datos exploratorios . Nueva York: Addison-Wesley. ISBN 0-201-07616-0.
  • Finlay, Steven (2014). Análisis predictivo, minería de datos y big data. Mitos, conceptos erróneos y métodos . Basingstoke: Palgrave Macmillan. ISBN 978-1-137-37927-6.
  • Coker, Frank (2014). Pulse: Comprensión de los signos vitales de su negocio . Bellevue, WA: Publicación de luz ambiental. ISBN 978-0-9893086-0-1.