Diferencia entre clasificación y regresión

Diferencia entre clasificación y regresión

El diferencia clave entre la clasificación y el árbol de regresión es que En la clasificación, las variables dependientes son categóricas y desordenadas, mientras que en la regresión las variables dependientes son valores enteros continuos u ordenados.

La clasificación y la regresión son técnicas de aprendizaje para crear modelos de predicción a partir de datos recopilados. Ambas técnicas se presentan gráficamente como árboles de clasificación y regresión, o más bien diagramas de flujo con divisiones de datos después de cada paso, o más bien, "rama" en el árbol. Este proceso se llama partición recursiva. Los campos como la minería utiliza estas técnicas de aprendizaje de clasificación y regresión. Este artículo se centra en el árbol de clasificación y el árbol de regresión.

CONTENIDO

1. Descripción general y diferencia de claves
2. ¿Qué es la clasificación?
3. Que es la regresión
4. Comparación de lado a lado - Clasificación versus regresión en forma tabular
5. Resumen

¿Qué es la clasificación??

La clasificación es una técnica utilizada para llegar a un esquema que muestra la organización de datos que comienza con una variable precursora. Las variables dependientes son las que clasifican los datos.

Figura 01: Minería de datos

El árbol de clasificación comienza con la variable independiente, que se ramifica en dos grupos según lo determinado por las variables dependientes existentes. Está destinado a dilucidar las respuestas en forma de categorización provocada por las variables dependientes.

Que es la regresión

La regresión es un método de predicción que se basa en un valor de salida numérico asumido o conocido. Este valor de salida es el resultado de una serie de particiones recursivas, y cada paso tiene un valor numérico y otro grupo de variables dependientes que se ramifican a otro par como este.

El árbol de regresión comienza con una o más variables precursores y termina con una variable de salida final. Las variables dependientes son variables numéricas continuas o discretas.

¿Cuál es la diferencia entre clasificación y regresión??

 Clasificación vs regresión

Un modelo de árbol donde la variable objetivo puede tomar un conjunto discreto de valores. Un modelo de árbol donde la variable objetivo puede tomar los valores continuos típicamente números reales.
Variable dependiente
Para el árbol de clasificación, las variables dependientes son categóricas. Para el árbol de regresión, las variables dependientes son numéricas.
Valores
Tiene una cantidad establecida de valores desordenados. Tiene valores discretos pero ordenados o valores indiscretos.
Propósito de la construcción
El propósito de construir el árbol de regresión es ajustar un sistema de regresión a cada rama determinante de manera que surja el valor de salida esperado. Un árbol de clasificación se ramifica según lo determinado por una variable dependiente derivada del nodo anterior.

Resumen -Clasificación vs Regresión

Los árboles de regresión y clasificación son técnicas útiles para trazar el proceso que apunta a un resultado estudiado, ya sea en clasificación o un solo valor numérico. La diferencia entre el árbol de clasificación y el árbol de regresión es su variable dependiente. Los árboles de clasificación tienen variables dependientes que son categóricas y desordenadas. Los árboles de regresión tienen variables dependientes que son valores continuos o valores completos.

Referencia:

1."Aprendizaje de árboles de decisión." Wikipedia, Fundación Wikimedia, 13 de mayo de 2018. Disponible aquí 

Imagen de cortesía:

1.'Minería de datos' por Arbeck - Trabajo propio, (CC por 3.0) a través de Commons Wikimedia