Page 204 - La investigación como vínculo enter educación y sociedad
P. 204
Para este trabajo se empleó una versión modificada del método K-Medias, denominada
LK-Medias, escrita en lenguaje C, la cual se describe a continuación:
Recibe como parámetros de entrada
1. Número de clases o categorías a identificar.
2. Número total de ejemplares que participan en el conjunto de en-
trenamiento (en este trabajo, cada ejemplar del conjunto de entrena-
miento también será denominado punto).
3. Factor numérico XFactor, estimado según el número de ejempla-
res, aplicado en cada iteración; para esto, se selecciona el dato con
mayor valor y se suma al valor de los nuevos centroides. XFactor es
un elemento adicional al método tradicional, pues modifica el compor-
tamiento del método aplicado en función de las iteraciones realizadas.
Este fue agregado como una aportación propia del autor de la versión
LK-Medias, lo cual, entre otras cosas, lo distingue de la versión origi-
nal.
4. Número de atributos o características que identifican a cada ejem-
plar. LA INVESTIGACIÓN COMO VÍNCULO ENTRE EDUCACIÓN Y SOCIEDAD
Procesamiento de la información
1. Al iniciar, el algoritmo selecciona al azar un número de puntos equi-
parable al número de clases, que identifica como centroides; para ello,
utiliza como semilla el número de ejemplares que participan como un
elemento aportado por el autor de la versión LK-Medias, que lo distin-
gue de la versión original.
2. Como métrica para calcular las distancias de un punto a otro en
el conjunto de datos, el algoritmo LK-Medias puede utilizar cualquiera
de las fórmulas existentes, al igual que el resto de las versiones de los
algoritmos que hay basados en el método K-Medias. Para este caso
se utilizó la distancia euclidiana.
3. Se calcula la cercanía de cada punto o ejemplar del conjunto de
entrenamiento a los puntos identificados como centroides y se asigna
al grupo o subconjunto cuya distancia sea menor.
4. Una vez agrupados los puntos, se calcula la media de cada uno 183
y se suma el XFactor a razón del número de ejemplares asignados a