MATLAB es un paquete de software estándar de la industria para el análisis de una variedad de datos técnicos y científicos . Un objetivo fundamental de muchos métodos de análisis es reconocer patrones en los datos subyacentes. A menudo, esto implica la división de datos en distintos grupos o racimos. Un algoritmo de agrupamiento usado frecuentemente es borrosa c - significa la agrupación , desarrollado por Dunn en 1973 y mejorado por Bezdek en 1981 . Descripción
fuzzy c -means clustering o FCM , puntos de datos puede pertenecer a más de un grupo . Un algoritmo iterativo minimiza una función objetivo para encontrar la composición óptima de clúster para cada punto en el que los datos sean agrupados . Iteración del algoritmo de clustering se detendrá cuando la función objetivo alcanza un mínimo local o punto de silla . FCM se puede combinar con otros algoritmos de búsqueda con el fin de garantizar un resultado óptimo
Objetivo Función
La FCM función objetivo J_M es igual a: .
< P > suma ( i = 1 ... N) [ suma ( j = 1 ... C ) [ u_ij ^ m norma ( x_i - C_J ) ^ 2 ] ]
La función objetivo se considera sobre los valores reales de m entre el 1 y el infinito positivo. El valor u_ij es la composición del punto x_i datos en el cluster j , centrado en C_J
Algoritmo
El algoritmo de optimización FCM tiene cuatro pasos. :
1 . Inicializar la matriz U_0 = [ u_ij ] 0.2 . Calcular el clúster centros C_K = [ C_J ] de u_k , donde k es un número entero igual iteración de la algorithm.3 . Actualizado U_ ( k +1 ) de la nueva C_k.4 . Calcular el valor de J_k . Si la nueva parada causada J_k para aumentar , parada , de lo contrario volverá al paso 2 .
MATLAB Uso
MATLAB implementa fuzzy c -means clustering en la función fcm () . Se requiere que la caja de herramientas de la lógica difusa para el uso de la función de FCM ( ) . La sintaxis de la llamada es :
[ centros , U , objFun ] = FCM ( my_data , n_clusters ) ;
La variable my_data es los datos de entrada , donde cada fila representa un punto de datos . La variable n_clusters es el número de conglomerados para agrupar los datos. La salida es la matriz de centros de centros de racimo óptimas . U es la partición difusa óptima o matriz membresía. La variable objFun es el valor final de la función objetivo.