Diseño de medidas repetidas - Repeated measures design

El diseño de medidas repetidas es un diseño de investigación que involucra múltiples medidas de la misma variable tomadas en los mismos sujetos o sujetos emparejados, ya sea en diferentes condiciones o durante dos o más períodos de tiempo. Por ejemplo, las mediciones repetidas se recopilan en un estudio longitudinal en el que se evalúan los cambios en el tiempo.

Estudios cruzados

Un método popular de medidas repetidas es el estudio cruzado . Un estudio cruzado es un estudio longitudinal en el que los sujetos reciben una secuencia de diferentes tratamientos (o exposiciones). Si bien los estudios cruzados pueden ser estudios de observación , muchos estudios cruzados importantes son experimentos controlados . Los diseños cruzados son comunes para experimentos en muchas disciplinas científicas , por ejemplo , psicología , educación , ciencia farmacéutica y atención médica , especialmente medicina.

Los experimentos cruzados, controlados y aleatorizados son especialmente importantes en el cuidado de la salud. En un ensayo clínico aleatorizado , a los sujetos se les asignan tratamientos al azar . Cuando tal ensayo es un diseño de medidas repetidas, los sujetos se asignan al azar a una secuencia de tratamientos. Un ensayo clínico cruzado es un diseño de medidas repetidas en el que cada paciente se asigna aleatoriamente a una secuencia de tratamientos, que incluyen al menos dos tratamientos (de los cuales uno puede ser un tratamiento estándar o un placebo ): por lo tanto, cada paciente pasa de un tratamiento a otro.

Casi todos los diseños cruzados tienen "equilibrio", lo que significa que todos los sujetos deben recibir el mismo número de tratamientos y que todos los sujetos participan durante el mismo número de períodos. En la mayoría de los ensayos cruzados, cada sujeto recibe todos los tratamientos.

Sin embargo, muchos diseños de medidas repetidas no son cruzados: el estudio longitudinal de los efectos secuenciales de tratamientos repetidos no necesita utilizar ningún " cruce ", por ejemplo (Vonesh y Chinchilli; Jones y Kenward).

Usos

  • Número limitado de participantes: el diseño de medidas repetidas reduce la varianza de las estimaciones de los efectos del tratamiento, lo que permite realizar inferencias estadísticas con menos sujetos.
  • Eficiencia: los diseños de medidas repetidas permiten que muchos experimentos se completen más rápidamente, ya que es necesario capacitar a menos grupos para completar un experimento completo. Por ejemplo, los experimentos en los que cada condición toma solo unos minutos, mientras que el entrenamiento para completar las tareas toma tanto tiempo, si no más.
  • Análisis longitudinal: los diseños de medidas repetidas permiten a los investigadores monitorear cómo cambian los participantes a lo largo del tiempo, tanto en situaciones de corto como de largo plazo.

Efectos de orden

Los efectos de orden pueden ocurrir cuando un participante en un experimento puede realizar una tarea y luego realizarla nuevamente. Los ejemplos de efectos de orden incluyen la mejora del rendimiento o la disminución del rendimiento, que pueden deberse a efectos de aprendizaje, aburrimiento o fatiga. El impacto de los efectos del orden puede ser menor en estudios longitudinales a largo plazo o mediante el contrapeso mediante un diseño cruzado .

Contrapeso

En esta técnica, dos grupos realizan cada uno las mismas tareas o experimentan las mismas condiciones, pero en orden inverso. Con dos tareas o condiciones, se forman cuatro grupos.

Contrapeso
Tarea / Condición Tarea / Condición Observaciones
Grupo A
1
2
El Grupo A realiza la Tarea / Condición 1 primero, luego la Tarea / Condición 2
Grupo B
2
1
El Grupo B realiza la Tarea / Condición 2 primero, luego la Tarea / Condición 1

El contrapeso intenta tener en cuenta dos fuentes importantes de variación sistemática en este tipo de diseño: la práctica y los efectos del aburrimiento. De lo contrario, ambos podrían conducir a un desempeño diferente de los participantes debido a la familiaridad o el cansancio con los tratamientos.

Limitaciones

Puede que no sea posible que cada participante esté en todas las condiciones del experimento (es decir, limitaciones de tiempo, ubicación del experimento, etc.). Los sujetos gravemente enfermos tienden a abandonar los estudios longitudinales, lo que puede sesgar los resultados. En estos casos , serían preferibles los modelos de efectos mixtos, ya que pueden tratar con valores perdidos.

La regresión media puede afectar condiciones con repeticiones significativas. La maduración puede afectar los estudios que se prolongan en el tiempo. Los eventos fuera del experimento pueden cambiar la respuesta entre repeticiones.

ANOVA de medidas repetidas

El análisis de varianza de medidas repetidas (rANOVA) es un enfoque estadístico comúnmente utilizado para los diseños de medidas repetidas. Con tales diseños, el factor de medida repetida (la variable independiente cualitativa) es el factor intra-sujetos, mientras que la variable cuantitativa dependiente en la que se mide a cada participante es la variable dependiente.

Partición de error

Una de las mayores ventajas de rANOVA, como es el caso de los diseños de medidas repetidas en general, es la capacidad de dividir la variabilidad debido a diferencias individuales. Considere la estructura general del estadístico F :

F = Tratamiento MS / Error MS = ( Tratamiento SS / Tratamiento df ) / ( Error SS / Error df )

En un diseño inter-sujetos hay un elemento de varianza debido a la diferencia individual que se combina con los términos de tratamiento y error:

SS Total = SS Tratamiento + SS Error
df Total = n - 1

En un diseño de medidas repetidas es posible dividir la variabilidad del sujeto de los términos de tratamiento y error. En tal caso, la variabilidad se puede dividir en variabilidad entre tratamientos (o efectos dentro de los sujetos, excluyendo las diferencias individuales) y variabilidad dentro de los tratamientos. La variabilidad dentro de los tratamientos se puede dividir en variabilidad entre sujetos (diferencias individuales) y error (excluyendo las diferencias individuales):

SS Total = SS Tratamiento (excluyendo la diferencia individual) + SS Sujetos + SS Error
gl Total = gl Tratamiento (dentro de los sujetos) + gl entre sujetos + error gl = ( k - 1) + ( n - 1) + (( n - k ) ( n - 1))

En referencia a la estructura general del estadístico F, está claro que al dividir la variabilidad entre sujetos, el valor F aumentará porque la suma del término de error de cuadrados será menor, lo que dará como resultado un error MSError menor. Cabe señalar que la variabilidad de partición reduce los grados de libertad de la prueba F, por lo que la variabilidad entre sujetos debe ser lo suficientemente significativa como para compensar la pérdida en grados de libertad. Si la variabilidad entre sujetos es pequeña, este proceso puede reducir el valor F.

Supuestos

Al igual que con todos los análisis estadísticos, deben cumplirse supuestos específicos para justificar el uso de esta prueba. Las infracciones pueden afectar de forma moderada a grave los resultados y, a menudo, provocar una inflación del error de tipo 1 . Con el rANOVA, se aplican supuestos estándar univariados y multivariados. Los supuestos univariados son:

  • Normalidad: para cada nivel del factor intra-sujetos, la variable dependiente debe tener una distribución normal .
  • Esfericidad: las puntuaciones de diferencia calculadas entre dos niveles de un factor intra-sujetos deben tener la misma varianza para la comparación de dos niveles cualesquiera. (Esta suposición solo se aplica si hay más de 2 niveles de la variable independiente).
  • Aleatoriedad: los casos deben derivarse de una muestra aleatoria y las puntuaciones de los diferentes participantes deben ser independientes entre sí.

El rANOVA también requiere que se cumplan ciertos supuestos multivariados, porque se realiza una prueba multivariante en puntuaciones de diferencia. Estos supuestos incluyen:

  • Normalidad multivariante: las puntuaciones de diferencia se distribuyen normalmente de forma multivariante en la población.
  • Aleatoriedad: los casos individuales deben derivarse de una muestra aleatoria y las puntuaciones de diferencia para cada participante son independientes de las de otro participante.

Prueba F

Al igual que con otros análisis de pruebas de varianza, rANOVA utiliza una estadística F para determinar la significancia. Dependiendo del número de factores intra-sujetos y violaciones de supuestos, es necesario seleccionar la más apropiada de tres pruebas:

  • Prueba ANOVA F univariante estándar: esta prueba se usa comúnmente dados solo dos niveles del factor intra-sujetos (es decir, punto de tiempo 1 y punto de tiempo 2). Esta prueba no se recomienda dados más de 2 niveles del factor intra-sujetos porque el supuesto de esfericidad se viola comúnmente en tales casos.
  • Prueba univariante alternativa: estas pruebas tienen en cuenta las violaciones al supuesto de esfericidad y se pueden usar cuando el factor intra-sujetos excede 2 niveles. El estadístico F es el mismo que en la prueba F de ANOVA univariante estándar, pero se asocia con un valor p más preciso. Esta corrección se realiza ajustando los grados de libertad hacia abajo para determinar el valor F crítico. Normalmente se utilizan dos correcciones: la corrección de efecto invernadero-Geisser y la corrección de Huynh-Feldt. La corrección de Greenhouse-Geisser es más conservadora, pero aborda un problema común de aumentar la variabilidad a lo largo del tiempo en un diseño de medidas repetidas. La corrección de Huynh-Feldt es menos conservadora, pero no aborda problemas de variabilidad creciente. Se ha sugerido que la parte inferior de Huynh-Feldt se use con desviaciones más pequeñas de la esfericidad, mientras que Greenhouse-Geisser se use cuando las desviaciones sean grandes.
  • Prueba multivariante: esta prueba no asume esfericidad, pero también es muy conservadora.

Tamaño del efecto

Una de las estadísticas de tamaño del efecto más comúnmente informadas para rANOVA es el eta-cuadrado parcial (η p 2 ). También es común utilizar el η 2 multivariante cuando se ha violado el supuesto de esfericidad y se informa la estadística de prueba multivariante. Un tercer estadístico del tamaño del efecto que se informa es el η 2 generalizado , que es comparable con η p 2 en un ANOVA de medidas repetidas de una vía. Se ha demostrado que es una mejor estimación del tamaño del efecto con otras pruebas intraindividuales.

Precauciones

rANOVA no siempre es el mejor análisis estadístico para diseños de medidas repetidas. El rANOVA es vulnerable a los efectos de valores perdidos, imputación, puntos de tiempo no equivalentes entre sujetos y violaciones de la esfericidad. Estos problemas pueden resultar en un sesgo de muestreo y tasas infladas de error de Tipo I. En tales casos, puede ser mejor considerar el uso de un modelo lineal mixto .

Ver también

Notas

Referencias

Diseño y análisis de experimentos

  • Jones, Byron; Kenward, Michael G. (2003). Diseño y análisis de ensayos cruzados (segunda ed.). Londres: Chapman y Hall.
  • Vonesh, Edward F. y Chinchilli, Vernon G. (1997). Modelos lineales y no lineales para el análisis de medidas repetidas . Londres: Chapman y Hall.

Exploración de datos longitudinales

  • Davidian, Marie ; David M. Giltinan (1995). Modelos no lineales para datos de medición repetidos . Monografías de Chapman & Hall / CRC sobre estadística y probabilidad aplicada. ISBN   978-0-412-98341-2 .
  • Fitzmaurice, Garrett; Davidian, Marie; Verbeke, Geert; Molenberghs, Geert, eds. (2008). Análisis de datos longitudinales . Boca Raton, Florida: Chapman y Hall / CRC. ISBN   978-1-58488-658-7 .
  • Jones, Byron; Kenward, Michael G. (2003). Diseño y análisis de ensayos cruzados (segunda ed.). Londres: Chapman y Hall.
  • Kim, Kevin y Timm, Neil (2007). " " Modelo de curva de crecimiento y MGLM restringido "(Capítulo 7)". Modelos lineales generales univariados y multivariados: Teoría y aplicaciones con SAS (con 1 CD-ROM para Windows y UNIX) . Estadística: libros de texto y monografías (segunda ed.). Boca Raton, Florida: Chapman & Hall / CRC. ISBN   978-1-58488-634-1 .
  • Kollo, Tõnu y von Rosen, Dietrich (2005). " " Modelos lineales multivariantes "(capítulo 4), especialmente" El modelo de curva de crecimiento y extensiones "(capítulo 4.1)". Estadística multivariante avanzada con matrices . Matemáticas y sus aplicaciones. 579 . Nueva York: Springer. ISBN   978-1-4020-3418-3 .
  • Kshirsagar, Anant M. y Smith, William Boyce (1995). Curvas de crecimiento . Estadísticas: libros de texto y monografías. 145 . Nueva York: Marcel Dekker, Inc. ISBN   0-8247-9341-2 .
  • Pan, Jian-Xin y Fang, Kai-Tai (2002). Modelos de curvas de crecimiento y diagnósticos estadísticos . Springer Series en Estadística. Nueva York: Springer-Verlag. ISBN   0-387-95053-2 .
  • Seber, GAF y Wild, CJ (1989). " " Modelos de crecimiento (Capítulo 7) " ". Regresión no lineal . Serie de Wiley en Probabilidad y Estadística Matemática: Probabilidad y Estadística Matemática. Nueva York: John Wiley & Sons, Inc. págs. 325–367. ISBN   0-471-61760-1 .
  • Timm, Neil H. (2002). " " El modelo general MANOVA (GMANOVA) "(Capítulo 3.6.d)". Análisis multivariado aplicado . Springer Texts in Statistics. Nueva York: Springer-Verlag. ISBN   0-387-95347-7 .
  • Vonesh, Edward F. y Chinchilli, Vernon G. (1997). Modelos lineales y no lineales para el análisis de medidas repetidas . Londres: Chapman y Hall. (Tratamiento integral de teoría y práctica)
  • Conaway, M. (1999, 11 de octubre). Diseño de medidas repetidas. Obtenido el 18 de febrero de 2008 de http://biostat.mc.vanderbilt.edu/twiki/pub/Main/ClinStat/repmeas.PDF
  • Minke, A. (1997, enero). Realización de análisis de medidas repetidas: consideraciones de diseño experimental. Obtenido el 18 de febrero de 2008 de Ericae.net: http://ericae.net/ft/tamu/Rm.htm
  • Shaughnessy, JJ (2006). Métodos de investigación en psicología. Nueva York: McGraw-Hill.

enlaces externos