Page 41 - LA INVESTIGACIÓN: CUANDO PARA RESOLVER UN PROBLEMA, ANTES HAY QUE CREARLO
P. 41

La investigación: cuando para resolver un problema, antes hay que crearlo





               Asimismo, y con el fin de reducir la dimensionalidad de la base de datos, se aplicaron técnicas de
               inteligencia artificial en la selección de las variables de la encuesta. En este caso, se realizó el proceso
               para establecer y seleccionar las preguntas esenciales para determinar lo siguiente: ¿regresaría para
               recibir los servicios de Los Algodones? y ¿recomendaría los servicios de Los Algodones? Muestra:
               Conjunto de 23 variables, siendo las respuestas de un solo encuestado. Primeramente, luego de
               definir el algoritmo empleado, se establecieron clasificadores simples como los “modelos de clasifi-
               cación lineal”, los cuales, dependiendo de la complicación de las variables y sus etiquetas de clase
               en el espacio, proporcionan una vista de la separación entre clase. Ya que las respuestas a las pre-
               guntas se pueden reflejar en número de 1 al 10, las distancias entre los números reflejan el grado de
               satisfacción del cliente en la pregunta. Se pueden usar algoritmos de la distancia euclidiana. El clasifi-
               cador lineal para esta tarea es el discriminante lineal, el cual se puede reflejar con la siguiente fórmula:








               Siendo q  (x), es la probabilidad de que una muestra  pertenezca a una clase j, x = {x1, x2,...x23},  un
                         j
               vector integrado por las variables enumeradas de 1 al 23, reflejando una muestra.    es la covarianza
               (se hace uso de la covarianza que tiene mayores muestras),     es la media de cada clase j (la cual
               puede ser la que se está probando en el momento) y               es la probabilidad de que ocurra una
               clase dado el número de veces que aparece en la base de datos, es decir, la cantidad de veces que
               aparece una clase dividida entre el número total de muestras en la base de datos. Cada etiqueta
               de clase tiene los parámetros de      y          , entonces, cuando se quiera determinar a qué clase
               pertenece una muestra, se tiene que aplicar la fórmula anterior a cada muestra por cada uno de las
      40       clases posibles con sus parámetros correspondientes. En consecuencia, se dice que una muestra

               pertenece a una clase que tiene mayor probabilidad de ocurrir (Parra, 2017). Haciendo correr los
               algoritmos envoltorios, se encontraron los siguientes resultados (tabla 3):
   36   37   38   39   40   41   42   43   44   45   46