Page 41 - LA INVESTIGACIÓN: CUANDO PARA RESOLVER UN PROBLEMA, ANTES HAY QUE CREARLO
P. 41
La investigación: cuando para resolver un problema, antes hay que crearlo
Asimismo, y con el fin de reducir la dimensionalidad de la base de datos, se aplicaron técnicas de
inteligencia artificial en la selección de las variables de la encuesta. En este caso, se realizó el proceso
para establecer y seleccionar las preguntas esenciales para determinar lo siguiente: ¿regresaría para
recibir los servicios de Los Algodones? y ¿recomendaría los servicios de Los Algodones? Muestra:
Conjunto de 23 variables, siendo las respuestas de un solo encuestado. Primeramente, luego de
definir el algoritmo empleado, se establecieron clasificadores simples como los “modelos de clasifi-
cación lineal”, los cuales, dependiendo de la complicación de las variables y sus etiquetas de clase
en el espacio, proporcionan una vista de la separación entre clase. Ya que las respuestas a las pre-
guntas se pueden reflejar en número de 1 al 10, las distancias entre los números reflejan el grado de
satisfacción del cliente en la pregunta. Se pueden usar algoritmos de la distancia euclidiana. El clasifi-
cador lineal para esta tarea es el discriminante lineal, el cual se puede reflejar con la siguiente fórmula:
Siendo q (x), es la probabilidad de que una muestra pertenezca a una clase j, x = {x1, x2,...x23}, un
j
vector integrado por las variables enumeradas de 1 al 23, reflejando una muestra. es la covarianza
(se hace uso de la covarianza que tiene mayores muestras), es la media de cada clase j (la cual
puede ser la que se está probando en el momento) y es la probabilidad de que ocurra una
clase dado el número de veces que aparece en la base de datos, es decir, la cantidad de veces que
aparece una clase dividida entre el número total de muestras en la base de datos. Cada etiqueta
de clase tiene los parámetros de y , entonces, cuando se quiera determinar a qué clase
pertenece una muestra, se tiene que aplicar la fórmula anterior a cada muestra por cada uno de las
40 clases posibles con sus parámetros correspondientes. En consecuencia, se dice que una muestra
pertenece a una clase que tiene mayor probabilidad de ocurrir (Parra, 2017). Haciendo correr los
algoritmos envoltorios, se encontraron los siguientes resultados (tabla 3):