Información agregada - Aggregate data

Un diagrama que muestra el significado básico de los datos agregados, que es una combinación de datos individuales.

Los datos agregados es de alto nivel de datos que se adquiere mediante la combinación de datos de nivel individual. Por ejemplo, la producción de una industria es un agregado de las salidas individuales de las empresas dentro de esa industria. Los datos agregados se aplican en estadísticas, almacenes de datos y economía.

Existe una distinción entre datos agregados y datos individuales. Los datos agregados se refieren a datos individuales que se promedian por área geográfica, por año, por agencia de servicios o por otros medios. Los datos individuales son resultados individuales desagregados y se utilizan para realizar análisis para estimar las diferencias de subgrupos.

Los datos agregados son utilizados principalmente por investigadores y analistas, formuladores de políticas, bancos y administradores por múltiples razones. Se utilizan para evaluar políticas, reconocer tendencias y patrones de procesos, obtener conocimientos relevantes y evaluar las medidas actuales para la planificación estratégica. Los datos agregados recopilados de diversas fuentes se utilizan en diferentes áreas de estudios, como el análisis político comparativo y el análisis científico de APD, para análisis adicionales. Los datos agregados también se utilizan con fines médicos y educativos. Los datos agregados se utilizan ampliamente, pero también tienen algunas limitaciones, como la elaboración de inferencias inexactas y conclusiones falsas, lo que también se denomina " falacia ecológica ". 'Falacia ecológica' significa que no es válido para los usuarios sacar conclusiones sobre las relaciones ecológicas entre dos variables cuantitativas a nivel individual.

Aplicaciones

En estadística , los datos agregados son datos combinados de varias mediciones. Cuando se agregan datos, los grupos de observaciones se reemplazan con estadísticas de resumen basadas en esas observaciones.

En un almacén de datos , el uso de datos agregados reduce drásticamente el tiempo para consultar grandes conjuntos de datos. Los desarrolladores resumen previamente las consultas que se utilizan con regularidad, como las ventas semanales en varias dimensiones, por ejemplo, por jerarquía de artículos o jerarquía geográfica.

En economía , los datos agregados o los agregados de datos son datos de alto nivel que se componen de una multitud o combinación de otros datos más individuales, como:

Usuarios principales

Investigadores y analistas

Los investigadores utilizan datos agregados para comprender el espíritu prevaleciente , evaluar la esencia de las realidades sociales y una organización social, estipular los temas principales de interés en la investigación y proporcionar proyecciones en relación con la naturaleza de los problemas sociales. Los datos agregados son útiles para los investigadores cuando están interesados ​​en investigar las relaciones entre dos variables distintas a nivel agregado y las conexiones entre una variable agregada y una característica a nivel individual. Los investigadores también se han esforzado por evaluar las políticas, prácticas y preceptos de los sistemas de manera crítica con la ayuda de datos agregados, para investigar la pertinencia y eficacia correspondientes .

Responsables políticos

Los gobiernos utilizan datos agregados para desarrollar políticas más efectivas porque sirven como una medida de cuán capaz es un gobierno para ser consciente de las demandas y necesidades de sus ciudadanos y una medida de la forma en que un gobierno mantiene el orden social de manera efectiva. Por ejemplo, los gobiernos de todo el mundo utilizan datos agregados de ubicación móvil para el análisis en respuesta a Covid-19. Los datos agregados de ubicación móvil podrían proporcionar información sobre la efectividad de las medidas de distanciamiento social lanzadas por los gobiernos. Los gobiernos también utilizan datos agregados para identificar posibles "puntos calientes" y el potencial de transmisión.

Además de proyectar la efectividad de las políticas gubernamentales, también se toman análisis de datos agregados para evaluar la naturaleza, evaluar la extensión, reconocer la tendencia y estudiar el patrón de un fenómeno o proceso específico con el objetivo de diseñar estrategias, preparar a corto o largo plazo. políticas a largo plazo, y adoptar procedimientos eficaces y relevantes para su control o prevención. Los formuladores de políticas también utilizan datos de agregados financieros para evaluar las actividades económicas y financieras de las empresas y los hogares porque estos datos ayudan a identificar los riesgos asociados con la estabilidad financiera . Los formuladores de políticas pueden emplear datos agregados para comprender mejor la evolución de las condiciones económicas y financieras de un país.

Bancos

Los bancos recopilan datos agregados de un número significativo de clientes y luego anonimizan los datos mediante la eliminación de la información personal. La razón principal por la que los bancos utilizan datos agregados es estimar las tendencias económicas y obtener información sobre los grupos de clientes. Los bancos no pueden compartir los datos personales de los clientes , pero los datos agregados pueden compartirse con los clientes comerciales de los bancos y pueden acceder a ellos otros socios que también utilizan la misma plataforma para adquirir información sobre datos agregados.

En Australia, Commonwealth Bank proporciona a sus clientes comerciales datos anonimizados relacionados con sus clientes que se derivan de transacciones con tarjeta. La ANZ también proporciona a sus clientes comerciales datos anónimos que se recopilan de millones de transacciones de terminales comerciales y transacciones con tarjetas ANZ.

En el Reino Unido, la recopilación de datos agregados de atención de urgencia integrada (IUC ADC) proporciona información completa sobre la actividad de IUC, su rendimiento y la demanda de servicios. Sus datos provienen de los principales proveedores de datos responsables de ofrecer servicios integrados de atención de urgencia en Inglaterra. El Servicio Nacional de Salud (NHS) dependiente del Departamento de Salud y Atención Social (DHSC) en Inglaterra declaró que esta recopilación de datos agregados reemplazará el conjunto de datos mínimo NHS 111. También se utilizará como una fuente formal de estadísticas de la IUC, así como para supervisar los Indicadores Clave de Desempeño (KPI) del IUC ADC.

Administradores

Los administradores e intelectuales, así como las personas preocupadas por el bienestar de una región o de una sociedad, utilizan los datos empíricos disponibles a nivel nacional o regional como fuentes de referencia. En particular, los administradores utilizan datos agregados para evaluaciones en la atmósfera política, religiosa, social o de otro tipo actual de una nación para rastrear las brechas en las respuestas sociales relacionadas con el tiempo y el espacio, y para dictar prioridades de acción. Estas evaluaciones ayudan a los administradores a evaluar las medidas actuales que son útiles en la planificación estratégica futura y proporcionan indicadores sobre medidas correctivas efectivas.

Fuentes y métodos de recolección

Los datos agregados pueden ser una composición de varios tipos de escritos y registros, que incluyen biografía , autobiografía , relatos descriptivos y correspondencia. Por ejemplo, un investigador recopila, coteja o compila datos agregados mediante la utilización de múltiples mecanismos de investigación social , incluido el inventario , la entrevista , un cuestionario de opinión y un cuestionario o programa . Las agencias oficiales o no oficiales también recopilan y compilan datos agregados de manera continua mediante la utilización de las infraestructuras disponibles dentro de un departamento a nivel de campo.

Las fuentes de datos agregados también pueden considerarse herramientas para descubrir datos. En EE. UU., Algunos de los datos de EE. UU. Se presentan en forma de tablas. Entre los ejemplos de fuentes para estos datos agregados de EE. UU. Se incluyen la Oficina del Censo de los Estados Unidos , el Resumen estadístico de los Estados Unidos y el Explorador social. Los datos del Fondo Monetario Internacional , World DataBank y Penn World Table son ejemplos de fuentes de datos agregados internacionales y transaccionales.

Uso de datos agregados

Análisis político comparativo

Los datos agregados se utilizan en el análisis político comparativo porque los analistas no solo se centran en el comportamiento del individuo. También se centran en el comportamiento de las unidades regionales, incluidos los distritos electorales y las naciones. En los análisis de la actividad política, datos importantes como los relacionados con la industrialización , la urbanización y las redes de comunicación de masas no se expresan fácilmente en niveles individuales. Se expresan en términos per cápita para controlar las variaciones en el tamaño de la población de las unidades de área . Los datos agregados están ampliamente disponibles porque las naciones recopilan y publican datos demográficos, socioeconómicos y políticos. Esto facilita a los investigadores y analistas la realización de estudios de tendencias más largos y les permite llevar cambios y desarrollos con un enfoque más profundo.

Metanálisis científicos APD

Factores que incluyen la necesidad de tiempo, recursos considerables y una amplia cooperación internacional impidieron el uso del metanálisis de datos de pacientes individuales (DPI) , lo que llevó a que la mayoría de los metanálisis publicados se basaran en datos agregados de pacientes (DPA). Para adquirir datos en todos los ensayos sobre todos los pacientes, los datos agregados de los pacientes se recopilan a partir de estudios completos que se presentan en reuniones profesionales, se publican en la literatura médica o se suministran directamente por investigadores individuales. Los datos agregados de los pacientes son utilizados por usuarios que incluyen la Colaboración Cochrane , el Grupo de Trabajo de Servicios Preventivos de los Estados Unidos y múltiples sociedades profesionales para brindar apoyo a las guías de práctica clínica. Los datos agregados de pacientes también se utilizan en estudios de metanálisis de tiempo transcurrido hasta el evento, ya que los resultados pueden informar a los inversores sobre la conveniencia de proceder a realizar más metanálisis que se basan en datos de pacientes individuales que requieren muchos recursos.

Otros usos

Cuidado de la salud

En un sistema de información sanitaria, los datos agregados son la integración de datos sobre numerosos pacientes. No se puede rastrear a un paciente en particular basándose en datos agregados. Estos datos agregados son solo recuentos, incluidas la tuberculosis , la malaria u otras enfermedades. Los establecimientos de salud utilizan este tipo de estadísticas agregadas para generar informes e indicadores, y para llevar a cabo la planificación estratégica en sus sistemas de salud. En comparación con los datos agregados, los datos del paciente son datos individuales relacionados con un solo paciente, incluido el nombre, la edad, el diagnóstico y el historial médico. Los datos basados ​​en pacientes se utilizan principalmente para realizar un seguimiento del progreso de un paciente, como la respuesta del paciente a un tratamiento en particular, a lo largo del tiempo.

El archivo de datos COVID-19, también llamado COVID-ARC, agrega datos de estudios en todo el mundo . Los investigadores pueden tener acceso a los descubrimientos de colegas internacionales y forjar colaboraciones para facilitar los procesos involucrados en la lucha contra la enfermedad. Específicamente, el uso de datos de atención médica agregados permite a los proveedores de atención médica desbloquear conocimientos clínicos procesables cuando, por ejemplo, es posible obtener vistas completas de datos clínicos o registros continuos de pacientes.

Educación

Los datos agregados, como los datos demográficos agregados a nivel escolar y los datos agregados de logros a nivel escolar, se utilizan en análisis experimentales para evaluar las relaciones entre el rendimiento estudiantil y las intervenciones a nivel escolar. Los datos agregados también se pueden utilizar en análisis no experimentales, como el análisis de regresión discontinua y el análisis de series de tiempo interrumpido. No se requieren datos a nivel individual en estos análisis no experimentales. Por ejemplo, el análisis de series de tiempo interrumpido estima el impacto que trae un programa a nivel escolar al comparar el rendimiento de una escuela antes y después de que se lanza el programa cuando los datos a nivel individual no son necesarios.

Limitaciones

Durante el proceso de promediar unidades dentro de algún conglomerado o dentro de un país, se pierde información, lo que aumenta la probabilidad de extraer inferencias inexactas. La pérdida de información ocurre porque la agregación de datos ignora la variación individual como si fuera solo un tipo de ruido estadístico o error de medición. La inferencia también varía de uno a otro cuando se utilizan datos de empresas individuales o datos agregados para el análisis. Por ejemplo, el cálculo de los promedios de los países no tiene en cuenta las variables específicas de la empresa, como el tamaño de la empresa, la edad de la empresa o la concentración de propiedad de la empresa, pero el cálculo de los promedios individuales sí. Existen diferencias entre los resultados generados a partir de datos agregados y datos individuales.

También existe un problema de "falacia ecológica". El concepto fue creado por Robinson (1950). El significado del término es que la variabilidad alrededor de las medias a nivel individual es significativamente diferente de la variabilidad que abarca las medias agregadas. Con el concepto agregado, se expresan cosas distintas de los equivalentes individuales de los datos agregados, lo que significa que no se pueden sacar conclusiones a nivel individual. Aunque los datos agregados tienen una aplicabilidad más amplia que los datos a nivel individual, es más difícil para los investigadores abordarlos con el análisis de los resultados de los subgrupos cuando se utilizan datos agregados. Eventualmente, también se puede requerir información individual. El modelado de crecimiento y el modelado longitudinal basados ​​en datos agregados también son difíciles porque las variables pueden variar con el tiempo.

Otros tipos de datos agregados

Datos de agregados financieros

Los datos de agregados financieros son un tipo de datos agregados sobre el crédito y la oferta monetaria en Australia, que los responsables de la formulación de políticas utilizan para evaluar las actividades económicas y financieras de los hogares y las empresas.

Agregados de crédito

Los agregados crediticios son mediciones de los préstamos de los hogares y las empresas a los intermediarios financieros. La cantidad de fondos tomados en préstamo por las empresas para fines que incluyen inversiones en proyectos, compras de activos o administración de flujo de efectivo también se mide utilizando agregados crediticios.

Agregados monetarios

Los agregados monetarios son mediciones del dinero o instrumentos "similares al dinero" del sistema bancario, que se adeuda a las empresas y los hogares. Un ejemplo de un instrumento "similar al dinero" son los depósitos en la cuenta bancaria .

Datos agregados del censo

En el Reino Unido, los datos agregados del censo son datos generados como resultados de los censos del Reino Unido. Proporcionan información sobre las características socioeconómicas y demográficas de la población del país. Son una compilación de cálculos agregados o resumidos del número de individuos, residentes del hogar o familias en áreas geográficas particulares con características específicas, o compuestos de características, tomados de los sujetos de personas y lugares, poblaciones, familias, salud, etnia y religión, vivienda y trabajo.

Los datos agregados se utilizan como componentes de los resultados de los censos del Reino Unido. Se obtienen a partir del análisis de la información proporcionada en las declaraciones censales. Los datos agregados del censo se utilizan para comparar y describir las características de la población en varios lugares del Reino Unido porque pueden proporcionar información comparable en una variedad de niveles geográficos en todo el Reino Unido. Los datos agregados del censo también se utilizan en el sector académico con fines de enseñanza e investigación, así como para la ubicación del sitio y la comercialización en el sector privado.

Referencias