Page 198 - EL PROCESO DE INVESTIGACIÓN EN INSTITUCIONES DE EDUCACIÓN EN MÉXICO
P. 198
Otros motivos para probar la normalidad de la distribución de las bases de datos, se debe a
que en la investigación, los GLM se usan comúnmente para probar hipótesis relacionadas con
las diferencias de los niveles de uno o más factores de interés o para relacionar una variable
con otras variables o factores, en cuyos casos, es importante controlar la tasa de error general
de tipo I en el nivel mientras se mantiene la potencia estadística deseada (= 1- tasa de error
de tipo II) y evitar inferencias falsas (Stevens et al., 2017).
Definición del modelo general lineal
La relación entre variables normalmente distribuidas y agrupadas como causas y efectos pue-
de representarse de forma lineal considerando: 1) las variables de respuesta: variables de-
pendientes, comúnmente representadas por Yi; 2) las variables independientes, denominadas
factores o Xi; y 3) los parámetros o constantes específicas de un modelo específico.
Los factores que pueden ser fijos o aleatorios pueden ajustarse al modelo lineal general que en
términos matriciales está compuesto por:
* Para modelos fijos, Y = X +
* Para modelos aleatorios, Y = Z +
* Para modelos mixtos, Y = X + Z +
Donde Y = variable(s) de respuesta, y = vectores de parámetros, X y Z = matrices de EL PROCESO DE INVESTIGACIÓN EN INSTITUCIONES DE EDUCACIÓN EN MÉXICO
efectos fijos y aleatorios, y = errores aleatorios.
Los factores X pueden ser categóricos o continuos y estar asociados a Y como: 1) el nivel i de
un factor; o 2) la observación i de la variable independiente; en el primer caso, el modelo de
variables categóricas asociado al modelo de análisis de varianza (ANOVA), en el segundo, el
modelo es un modelo de regresión lineal:
* ANOVA, Y=µ+T+ ij
i
* Regresión lineal, Y= + X+ ij
o
i i
Donde: Y =variable de respuesta; µ = promedio general; T = factor o factores independientes,
i
o combinación de factores aplicados en las unidades experimentales; = intersección de la
o
línea con el eje de la ordenada (ordenada al origen); = cambios de Y en relación con cam-
i
bios (incrementos) en X (pendiente de la línea); X = variable continua independiente o variables
i
relacionadas con Y; = error aleatorio.
ij
En ambos casos, los parámetros se vuelven a calcular para obtener la intersección específica
(µ o ) y los incrementos lineales de Y ( ), y la hipótesis es acerca de la dependencia de
i
o
Y a la (s) variable (s) independiente (s) que podrían leerse como “X afecta o explica a Y” para
la hipótesis alternativa y “X no afecta o no explica a Y” para la hipótesis nula. La mayoría de
los cambios de Y deben estar relacionados con los cambios de X, sí el modelo es válido para
i
explicar el fenómeno.
189