Diferencia entre RDBMS y Hadoop

Diferencia entre RDBMS y Hadoop

El diferencia clave entre RDBMS y Hadoop es que el RDBMS almacena datos estructurados mientras que Hadoop almacena datos estructurados, semiestructurados y no estructurados.

El RDBMS es un sistema de gestión de bases de datos basado en el modelo relacional. El Hadoop es un software para almacenar datos y ejecutar aplicaciones en grupos de hardware de productos básicos.

CONTENIDO

1. Descripción general y diferencia de claves
2. ¿Qué es RDBMS?
3. Que es Hadoop
4. Comparación de lado a lado: RDBMS vs Hadoop en forma tabular
5. Resumen

¿Qué es RDBMS??

RDBMS significa Sistema de gestión de bases de datos relacionales basado en el modelo relacional. En el RDBMS, las tablas se utilizan para almacenar datos, y las claves e índices ayudan a conectar las tablas. Una tabla es una colección de elementos de datos, y son las entidades. Contiene filas y columnas. Las filas representan una sola entrada en la tabla. Las columnas representan los atributos.

Por ejemplo, la base de datos de ventas puede tener entidades de clientes y productos.  El cliente puede tener atributos como customer_id, nombre, dirección, teléfono_no. El artículo puede tener atributos como Product_ID, Name, etc. La clave principal de la tabla de clientes es Customer_ID, mientras que la clave principal de la tabla de productos es Product_ID. Colocar el producto_id en la tabla de clientes como una clave extranjera conecta estas dos entidades. Del mismo modo, las tablas también están relacionadas entre sí.  Proporcionan integridad de datos, normalización y muchos más.  Pocos de los RDBM comunes son MySQL, MSSQL y Oracle. Usan SQL para consultar.

Que es Hadoop?

El Hadoop es un marco de código abierto Apache escrito en Java. Ayuda a almacenar y procesa una gran cantidad de datos en grupos de computadoras utilizando modelos de programación simples. El objetivo principal de Hadoop es almacenar y procesar Big Data, que se refiere a una gran cantidad de datos complejos. El rendimiento de Hadoop, que es la capacidad de procesar un volumen de datos dentro de un período particular de tiempo, es alto.

Hay cuatro módulos en la arquitectura de Hadoop. Son Hadoop Common, Yarn, Hadoop Distributed File System (HDFS) y Hadoop MapReduce. El módulo común contiene las bibliotecas y utilidades de Java. También tiene los archivos para comenzar Hadoop. Hadoop Yarn realiza la programación de trabajo y la gestión de recursos de clúster.

Además, el sistema de archivos distribuido (HDFS) de Hadoop es el sistema de almacenamiento Hadoop. Utiliza la arquitectura maestra-esclavo. El nodo maestro es el NameNode, y administra los meta datos del sistema de archivos. Otras computadoras son nodos de esclavos o datanodes. Almacenan los datos reales. Por otro lado, Hadoop MapReduce hace el cálculo distribuido. Tiene los algoritmos para procesar los datos. En el HDFS, el nodo maestro tiene un rastreador de trabajo. Ejecuta el mapa Reduce los trabajos en los nodos esclavos. Hay un rastreador de tareas para cada nodo esclavo para completar el procesamiento de datos y devolver el resultado al nodo maestro. En general, el Hadoop proporciona un almacenamiento masivo de datos con una alta potencia de procesamiento.

¿Cuál es la diferencia entre RDBMS y Hadoop??

Rdbms vs hadoop

RDBMS es un software de sistema para crear y administrar bases de datos que se basan en el modelo relacional. Hadoop es una colección de software de código abierto que conecta muchas computadoras para resolver problemas que involucran una gran cantidad de datos y computación.
 Variedad de datos
RDBMS almacena datos estructurados. Hadoop almacenes estructurados, semiestructurados y no estructurados.
Almacenamiento de datos
RDBMS almacena una cantidad promedio de datos. Hadoop almacena una gran cantidad de datos que RDBMS.
 Velocidad
En RDBMS, las lecturas son rápidas. En Hadoop, las lecturas y las escrituras son rápidas.
Escalabilidad
RDBMS tiene escalabilidad vertical. Hadoop tiene escalabilidad horizontal.
Hardware
RDBMS usa servidores de alta gama. Hadoop usa hardware de productos básicos.
  Rendimiento
El rendimiento de RDBMS es mayor. El rendimiento de Hadoop es más bajo.

Resumen -RDBMS vs Hadoop

Este artículo discutió la diferencia entre RDBMS y Hadoop. La diferencia clave entre RDBMS y Hadoop es que el RDBMS almacena datos estructurados, mientras que Hadoop almacena datos estructurados, semiestructurados y no estructurados.

Referencia:

1.Punto de tutorial. "Conceptos SQL RDBMS.", Tutorials Point, 8 de enero. 2018. Disponible aquí  
2.Punto de tutorial. "Tutorial de Hadoop.", Tutorials Point, 8 de enero. 2018. Disponible aquí  

Imagen de cortesía:

1.'8552968000' por Intel Free Press (CC By-SA 2.0) a través de Flickr