Diferencia entre la minería de datos y el almacenamiento de datos

Diferencia entre la minería de datos y el almacenamiento de datos

Minería de datos versus almacenamiento de datos

La minería de datos y el almacenamiento de datos son técnicas muy potentes y populares para analizar datos. Los usuarios que se inclinan hacia las estadísticas usan la minería de datos. Utilizan modelos estadísticos para buscar patrones ocultos en los datos. Los mineros de datos están interesados ​​en encontrar relaciones útiles entre diferentes elementos de datos, que en última instancia es rentable para las empresas. Pero, por otro lado, los expertos en datos que pueden analizar las dimensiones del negocio tienden directamente a usar almacenes de datos.

La minería de datos también se conoce como descubrimiento de conocimiento en datos (KDD). Como se mencionó anteriormente, es un campo de la informática, que se ocupa de la extracción de información previamente desconocida e interesante de datos sin procesar. Debido al crecimiento exponencial de los datos, especialmente en áreas como el negocio, la minería de datos se ha convertido en una herramienta muy importante para convertir esta gran riqueza de datos en inteligencia empresarial, ya que la extracción manual de patrones se ha vuelto aparentemente imposible en las últimas décadas. Por ejemplo, actualmente se ha utilizado para diversas aplicaciones, como el análisis de redes sociales, la detección de fraude y el marketing. La minería de datos generalmente se ocupa de las siguientes cuatro tareas: agrupación, clasificación, regresión y asociación. La agrupación está identificando grupos similares a partir de datos no estructurados. La clasificación son reglas de aprendizaje que se pueden aplicar a nuevos datos y generalmente incluirán los siguientes pasos: preprocesamiento de datos, diseño de modelado, aprendizaje/selección de características y evaluación/validación. La regresión es encontrar funciones con un error mínimo para modelar datos. Y la asociación está buscando relaciones entre variables. La minería de datos generalmente se usa para responder preguntas, como cuáles son los principales productos que podrían ayudar a obtener altas ganancias el próximo año en Wal-Mart?

Como se mencionó anteriormente, el almacenamiento de datos también se usa para analizar datos, pero por diferentes conjuntos de usuarios y un objetivo ligeramente diferente en mente. Por ejemplo, cuando se trata del sector minorista, los usuarios de almacenamiento de datos están más preocupados por los tipos de compras son populares entre los clientes, por lo que los resultados del análisis pueden ayudar al cliente al mejorar la experiencia del cliente. Pero los mineros de datos primero conjeturan una hipótesis como la cual los clientes compran un cierto tipo de producto y analizan los datos para probar la hipótesis. El almacenamiento de datos podría ser llevado a cabo por un minorista importante que inicialmente almacena sus tiendas con los mismos tamaños de productos para descubrir más tarde que las tiendas de Nueva York venden un inventario de menor tamaño mucho más rápido que en las tiendas de Chicago. Entonces, al observar este resultado, el minorista puede almacenar la tienda de Nueva York con tamaños más pequeños en comparación con las tiendas de Chicago.

Entonces, como puede ver claramente, estos dos tipos de análisis parecen ser de la misma naturaleza a simple vista. Ambos se preocupan por aumentar las ganancias basadas en los datos históricos. Pero, por supuesto, hay diferencias clave. En términos simples, la minería de datos y el almacenamiento de datos se dedican a proporcionar diferentes tipos de análisis, pero definitivamente para diferentes tipos de usuarios. En otras palabras, la minería de datos busca correlaciones, patrones para apoyar una hipótesis estadística. Pero, el almacenamiento de datos responde una pregunta relativamente más amplia y corta los datos de TI y los diecisos a partir de ahí para reconocer formas de mejora en el futuro.