Minería de datos vs OLAP
Tanto la minería de datos como OLAP son dos de las tecnologías comunes de inteligencia empresarial (BI). La inteligencia empresarial se refiere a los métodos basados en computadora para identificar y extraer información útil de los datos comerciales. La minería de datos es el campo de la informática que se ocupa de la extracción de patrones interesantes de grandes conjuntos de datos. Combina muchos métodos de inteligencia artificial, estadísticas y gestión de bases de datos. OLAP (procesamiento analítico en línea) Como su nombre sugiere, es una compilación de formas de consultar bases de datos multidimensionales.
La minería de datos también se conoce como descubrimiento de conocimiento en datos (KDD). Como se mencionó anteriormente, es un campo de la informática, que se ocupa de la extracción de información previamente desconocida e interesante de datos sin procesar. Debido al crecimiento exponencial de los datos, especialmente en áreas como el negocio, la minería de datos se ha convertido en una herramienta muy importante para convertir esta gran riqueza de datos en inteligencia empresarial, ya que la extracción manual de patrones se ha vuelto aparentemente imposible en las últimas décadas. Por ejemplo, actualmente se ha utilizado para diversas aplicaciones, como el análisis de redes sociales, la detección de fraude y el marketing. La minería de datos generalmente se ocupa de las siguientes cuatro tareas: agrupación, clasificación, regresión y asociación. La agrupación está identificando grupos similares a partir de datos no estructurados. La clasificación son reglas de aprendizaje que se pueden aplicar a nuevos datos y generalmente incluirán los siguientes pasos: preprocesamiento de datos, diseño de modelado, aprendizaje/selección de características y evaluación/validación. La regresión es encontrar funciones con un error mínimo para modelar datos. Y la asociación está buscando relaciones entre variables. La minería de datos generalmente se usa para responder preguntas, como cuáles son los principales productos que podrían ayudar a obtener altas ganancias el próximo año en Wal-Mart.
OLAP es una clase de sistemas que proporcionan respuestas a consultas multidimensionales. Por lo general, OLAP se utiliza para marketing, presupuesto, pronóstico y aplicaciones similares. No hace falta decir que las bases de datos utilizadas para OLAP están configuradas para consultas complejas y ad-hoc con un rendimiento rápido en mente. Por lo general, se usa una matriz para mostrar la salida de un OLAP. Las filas y las columnas están formadas por las dimensiones de la consulta. A menudo usan métodos de agregación en múltiples tablas para obtener resúmenes. Por ejemplo, se puede usar para conocer las ventas de este año en Wal-Mart en comparación con el año pasado? ¿Cuál es la predicción en las ventas en el próximo trimestre?? ¿Qué se puede decir sobre la tendencia al observar el porcentaje de cambio??
Aunque es obvio que la minería de datos y el OLAP son similares porque operan en datos para obtener inteligencia, la principal diferencia proviene de cómo operan en los datos. OLAP Tools proporciona análisis de datos multidimensionales y proporcionan resúmenes de los datos, pero en contraste, la minería de datos se centra en las relaciones, patrones e influencias en el conjunto de datos. Ese es un acuerdo OLAP con la agregación, que se reduce a la operación de datos a través de la "adición", pero la minería de datos corresponde a la "división". Otra diferencia notable es que, si bien las herramientas de minería de datos modelan datos y devuelven reglas procesables, OLAP llevará a cabo técnicas de comparación y contraste a lo largo de la dimensión comercial en tiempo real.