Page 197 - EL PROCESO DE INVESTIGACIÓN EN INSTITUCIONES DE EDUCACIÓN EN MÉXICO
P. 197
APlICACIóN eN el uSO De lOS PrOCeDIMIeNtOS geNerAleS lINeAleS (glM)
Aplicación del concepto de normalidad
En SAS, el análisis de varianza (ANOVA) y los procedimientos de regresión lineal forman parte
de un conjunto de procedimientos lineales (Procedimiento GLM) que buscan relacionar de for-
ma matemática variantes de la variable de respuesta a niveles (clases) de factores.
EL PROCESO DE INVESTIGACIÓN EN INSTITUCIONES DE EDUCACIÓN EN MÉXICO
La condición inicial para usar cualquier procedimiento GLM es asegurarse de que la base de
datos esté normalmente distribuida. En muchos casos, los supuestos de normalidad se violan
cuando la probabilidad de seleccionar cierta muestra no es idéntica o independiente de la
probabilidad de seleccionar otras muestras (probabilidades interdependientes), o cuando los
experimentos tienen menos de 34 observaciones.
La razón por la que la validez del uso de GLM parte de la normalidad de las variables que
componen el análisis, es que para aceptar o rechazar la Ho, se apoya de la distribución F,
donde se basa en (n-1) S / de una distribución de chi-cuadrado con n-1 grados
2
2
2
de libertad (GL: v), Z ~ N (con µ alrededor de 0, y alrededor de 1), ambos están relacionados
con las distribuciones chi-cuadrada y F:
1) El supuesto de distribución normal, parte del principio de que, si n es lo suficientemente
grande, la distribución de una variable aleatoria debe ser normal estándar. Esto significa que,
sin importar las distribuciones iniciales de los datos de las variables debido a los principios del
Teorema del Límite Central, es más probable una muestra compuesta por N igual o mayor a
35 se distribuya normalmente (Canavos, 1988).
2) La distribución de chi-cuadrada también parte del supuesto de que los elementos que com-
ponen las muestras han tenido probabilidades idénticas e independientes de ser selecciona-
dos, supuesto que se cumple al realizar una selección aleatoria. Esta distribución de probabili-
dad permite inferir las desviaciones de valores observados y esperados con algunos grados de
libertad (GL). Por lo tanto, aunque el gráfico de distribución de chi-cuadrada presenta un pico
más alto que el de la distribución normal, el coeficiente de asimetría tiende a cero y su curtosis
en función de los GL. Sin embargo, si Z es una variable ~ N (0, 1), cualquier variable (Y) igual a
Z se distribuye como chi-cuadrada si GL = 1, esto se debe a que la función de los momentos
2
de Y = Z con v= 1 es Idéntica a la función de momentos de chi-cuadrada.
2
3) Derivado de la distribución de chi-cuadrada, cuando dos variables independientes y alea-
torias (X e Y) se distribuyen con chi-cuadrada con v y v , F se define como una función de X
X
Y
e Y, F = (X/v )/(Y/v ), por lo tanto, F es la relación cociente entre dos variables chi-cuadrada
Y
X
distribuidas, pero considerando las mismas deducciones para la densidad de probabilidad de
t de Student (ya que el cálculo S implica la división de la suma de (Xi-X) por n-1, S debe ser
2
2
más grande que ).
188