minera patrón frecuente , también conocida como la minería conjunto de elementos frecuentes, es una técnica para descubrir grupos de elementos que a menudo se presentan juntas en una base de datos . De acuerdo con el Dr. Christian Borgelt , Investigador Principal en el Centro Europeo de Soft Computing , la minería patrón frecuente ha sido uno de los temas más investigados activamente en la minería de datos desde principios de 1990 y numerosos algoritmos matemáticos se han desarrollado. Patrón frecuente Minería
patrón de la minería es un problema frecuente primaria en muchas aplicaciones. Una base de datos transaccional típico - como una base de datos que describe el comportamiento de los compradores en la calle principal , por correo o en línea - contiene un gran número de conjuntos de elementos y presenta un desafío en términos de desarrollar algoritmos eficientes y escalables . Algoritmos de minería de patrones frecuentes conocidas como Apriori , Eclat y FP- crecimiento están entre los más conocidos .
Algoritmo Apriori
El algoritmo Apriori , propuesto por Rakesh Agrawal y Ramkrishnan Srikant del Centro de Investigación Almaden de IBM en 1994 , trabaja en el principio de que los conjuntos de elementos se contabilizan cuando se producen en las transacciones. La base de datos se explora para encontrar 1 - conjuntos de elementos frecuentes , los 1 - conjuntos de elementos se utilizan para generar los conjuntos de elementos - 2 y así sucesivamente hasta k- conjuntos de elementos . Un conjunto de elementos k - se dice que es frecuente si y sólo si todos sus subitemsets son frecuentes . Desde que se propuso por primera vez , se han sugerido numerosas mejoras en el algoritmo Apriori
FP- crecimiento Algoritmo
El algoritmo FP- crecimiento - . FP está para "El modelo frecuente" - emplea una técnica conocida como el algoritmo analiza la base de datos para crear una lista de elementos frecuentes en orden descendente , que se utiliza para comprimir la base de datos en un árbol de FP "divide y vencerás ". . El FP - árbol en sí se extrae , a partir de cada longitud de frecuentes - 1 patrón - también conocido como un patrón de sufijo - para crear un árbol de FP- condicional, que contiene prefijos correspondientes a los elementos que co - ocurrir con el patrón inicial sufijo . El patrón inicial sufijo se concatena con los patrones habituales halladas en la FP -tree condicional para lograr un crecimiento patrón.
Eclat Algoritmo
algoritmos Apriori y FP- crecimiento mina patrones frecuentes de un conjunto de transacciones dispuestas horizontalmente . El ( Eclat ) algoritmo de transformación clase de equivalencia - propuesto por J. Mohammed Zaki , un profesor de ciencias informáticas en el Instituto Politécnico Rensselaer , en 2000 - por otra parte, las minas de patrones frecuentes en una serie de transacciones de forma vertical . El algoritmo Eclat comienza con un solo elemento y utiliza una intersección de conjuntos para determinar los conjuntos de elementos frecuentes y se repite hasta que no hay más conjuntos de elementos frecuentes se pueden encontrar .