Page 197 - EL PROCESO DE INVESTIGACIÓN EN INSTITUCIONES DE EDUCACIÓN EN MÉXICO
P. 197

APlICACIóN eN el uSO De lOS PrOCeDIMIeNtOS geNerAleS lINeAleS (glM)



                  Aplicación del concepto de normalidad




                  En SAS, el análisis de varianza (ANOVA) y los procedimientos de regresión lineal forman parte
                  de un conjunto de procedimientos lineales (Procedimiento GLM) que buscan relacionar de for-
                  ma matemática variantes de la variable de respuesta a niveles (clases) de factores.
          EL PROCESO DE INVESTIGACIÓN EN INSTITUCIONES DE EDUCACIÓN EN MÉXICO
                  La condición inicial para usar cualquier procedimiento GLM es asegurarse de que la base de
                  datos esté normalmente distribuida. En muchos casos, los supuestos de normalidad se violan
                  cuando la probabilidad de seleccionar cierta muestra no es idéntica o independiente de la
                  probabilidad de seleccionar otras muestras (probabilidades interdependientes), o cuando los
                  experimentos tienen menos de 34 observaciones.

                  La razón por la que la validez del uso de GLM parte de la normalidad de las variables que
                  componen el análisis, es que para aceptar o rechazar la Ho, se apoya de la distribución F,
                  donde                 se basa en (n-1) S /      de una distribución de chi-cuadrado con n-1 grados
                                 2
                                                    2
                                                        2
                  de libertad (GL: v), Z ~ N (con µ alrededor de 0, y     alrededor de 1), ambos están relacionados
                  con las distribuciones chi-cuadrada y F:
                  1) El supuesto de distribución normal, parte del principio de que, si n es lo suficientemente
                  grande, la distribución de una variable aleatoria debe ser normal estándar. Esto significa que,
                  sin importar las distribuciones iniciales de los datos de las variables debido a los principios del
                  Teorema del Límite Central, es más probable una muestra compuesta por N igual o mayor a
                  35 se distribuya normalmente (Canavos, 1988).

                  2) La distribución de chi-cuadrada también parte del supuesto de que los elementos que com-
                  ponen las muestras han tenido probabilidades idénticas e independientes de ser selecciona-
                  dos, supuesto que se cumple al realizar una selección aleatoria.  Esta distribución de probabili-
                  dad permite inferir las desviaciones de valores observados y esperados con algunos grados de
                  libertad (GL). Por lo tanto, aunque el gráfico de distribución de chi-cuadrada presenta un pico
                  más alto que el de la distribución normal, el coeficiente de asimetría tiende a cero y su curtosis
                  en función de los GL. Sin embargo, si Z es una variable ~ N (0, 1), cualquier variable (Y) igual a
                  Z se distribuye como chi-cuadrada si GL = 1, esto se debe a que la función de los momentos
                   2
                  de Y = Z  con v= 1 es Idéntica a la función de momentos de chi-cuadrada.
                          2
                  3) Derivado de la distribución de chi-cuadrada, cuando dos variables independientes y alea-
                  torias (X e Y) se distribuyen con chi-cuadrada con v  y v , F se define como una función de X
                                                                   X
                                                                       Y
                  e Y, F = (X/v )/(Y/v ), por lo tanto, F es la relación cociente entre dos variables chi-cuadrada
                                    Y
                              X
                  distribuidas, pero considerando las mismas deducciones para la densidad de probabilidad de
                  t de Student (ya que el cálculo S implica la división de la suma de (Xi-X)  por n-1, S debe ser
                                                                                      2
                                                 2
                  más grande que     ).
          188
   192   193   194   195   196   197   198   199   200   201   202