Page 204 - La investigación como vínculo enter educación y sociedad
P. 204

Para  este  trabajo  se  empleó  una  versión  modificada  del  método  K-Medias,  denominada
                  LK-Medias, escrita en lenguaje C, la cual se describe a continuación:



                  Recibe como parámetros de entrada

                             1.  Número de clases o categorías a identificar.

                             2.  Número total de ejemplares que participan en el conjunto de en-

                             trenamiento (en este trabajo, cada ejemplar del conjunto de entrena-
                             miento también será denominado punto).

                             3.  Factor numérico XFactor, estimado según el número de ejempla-
                             res, aplicado en cada iteración; para esto, se selecciona el dato con
                             mayor valor y se suma al valor de los nuevos centroides. XFactor es
                             un elemento adicional al método tradicional, pues modifica el compor-
                             tamiento del método aplicado en función de las iteraciones realizadas.
                             Este fue agregado como una aportación propia del autor de la versión
                             LK-Medias, lo cual, entre otras cosas, lo distingue de la versión origi-
                             nal.


                             4.  Número de atributos o características que identifican a cada ejem-
                             plar.                                                                                 LA INVESTIGACIÓN COMO VÍNCULO ENTRE EDUCACIÓN Y SOCIEDAD




                  Procesamiento de la información

                             1.  Al iniciar, el algoritmo selecciona al azar un número de puntos equi-
                             parable al número de clases, que identifica como centroides; para ello,
                             utiliza como semilla el número de ejemplares que participan como un
                             elemento aportado por el autor de la versión LK-Medias, que lo distin-
                             gue de la versión original.

                             2.  Como métrica para calcular las distancias de un punto a otro en
                             el conjunto de datos, el algoritmo LK-Medias puede utilizar cualquiera
                             de las fórmulas existentes, al igual que el resto de las versiones de los
                             algoritmos que hay basados en el método K-Medias. Para este caso
                             se utilizó la distancia euclidiana.


                             3.  Se calcula la cercanía de cada punto o ejemplar del conjunto de
                             entrenamiento a los puntos identificados como centroides y se asigna
                             al grupo o subconjunto cuya distancia sea menor.

                             4.  Una vez agrupados los puntos, se calcula la media de cada uno               183
                             y se suma el XFactor a razón del número de ejemplares asignados a
   199   200   201   202   203   204   205   206   207   208   209