Page 189 - EL PROCESO DE INVESTIGACIÓN EN INSTITUCIONES DE EDUCACIÓN EN MÉXICO
P. 189
ABStrACt
Scientific method is based in the process of observation to generate hypothesis that relate
causes with effects that should be possible to test. Statistics are mathematical methods use-
ful to characterize, inference or even predict how the probability of changes of two or more
random variables. Along with the incorrect approach of null and alternative hypothesis, the
most important problems occur during the analyzing and discussion of data after a wrong
mathematical method has been selected, or when the definition of concept of probability is
EL PROCESO DE INVESTIGACIÓN EN INSTITUCIONES DE EDUCACIÓN EN MÉXICO
incorrect. In those cases, the derived conclusions from those research studies can be wrong.
Statistical Analysis Systems (SAS) has been widely used in data analyzing for research to test
the probability distribution of a random variable, the cause and effect relation, the type of effect
effects could have under other variables, the linearity, and use of general linear models’ (GLM)
methods. The aim of present document is to offer analyze the validity of cause-effects relation
GLM of SAS, showing the main algorithms and discussing the outputs.
Keywords: distribution of probability function, general linear models, scientific research, nor-
mality, SAS.
INtrODuCCIóN
Durante los procesos de diseño, análisis e interpretación de resultados de la investigación
científica, se considera que la validez de los resultados y conclusiones resultan de generar
hipótesis susceptibles de ser probadas de forma estocástica o determinística. Estos procesos
matemáticos brindan la posibilidad de establecer con mínimo grado de error las relaciones
entre variables de respuesta y factores. Independiente al enfoque y tipos de modelos que se
utilicen, el uso de modelos matemáticos permite generar asociaciones válidas para el diseño
de estrategias confiables (Ellis et al., 2008, 2010).
En tanto que la modelación determinística-teórica asocia de forma explicativa los elementos
que componen las variables dependientes e independientes, los modelos estocásticos-empí-
ricos parten de formas básicas de asociaciones con un efecto aleatorio residual llamado error.
Esta diferencia entre modelos estocásticos y determinísticos hace necesario probar la distribu-
ción de los datos antes de seleccionar el mejor método de análisis.
El ANOVA se agrupa dentro del conjunto de modelos generales lineales (GLM), cuya validez
parte de la normalidad de los datos de las variables bajo estudio (Canavos, 1988).
El paquete estadístico SAS se desarrolló en la Universidad Estatal de Carolina del Norte en
1976 y ha sido ampliamente utilizado en la investigación científica ya que permite diversos
tipos de análisis como multivariados, inteligencia empresarial, gestión de datos y análisis pre-
dictivo. Ali y Ho (2012) informaron que SAS se utilizó en el 42.6 % de los análisis de datos
publicados en revistas médicas.
180