El diferencia clave entre la clasificación y el árbol de regresión es que En la clasificación, las variables dependientes son categóricas y desordenadas, mientras que en la regresión las variables dependientes son valores enteros continuos u ordenados.
La clasificación y la regresión son técnicas de aprendizaje para crear modelos de predicción a partir de datos recopilados. Ambas técnicas se presentan gráficamente como árboles de clasificación y regresión, o más bien diagramas de flujo con divisiones de datos después de cada paso, o más bien, "rama" en el árbol. Este proceso se llama partición recursiva. Los campos como la minería utiliza estas técnicas de aprendizaje de clasificación y regresión. Este artículo se centra en el árbol de clasificación y el árbol de regresión.
1. Descripción general y diferencia de claves
2. ¿Qué es la clasificación?
3. Que es la regresión
4. Comparación de lado a lado - Clasificación versus regresión en forma tabular
5. Resumen
La clasificación es una técnica utilizada para llegar a un esquema que muestra la organización de datos que comienza con una variable precursora. Las variables dependientes son las que clasifican los datos.
Figura 01: Minería de datos
El árbol de clasificación comienza con la variable independiente, que se ramifica en dos grupos según lo determinado por las variables dependientes existentes. Está destinado a dilucidar las respuestas en forma de categorización provocada por las variables dependientes.
La regresión es un método de predicción que se basa en un valor de salida numérico asumido o conocido. Este valor de salida es el resultado de una serie de particiones recursivas, y cada paso tiene un valor numérico y otro grupo de variables dependientes que se ramifican a otro par como este.
El árbol de regresión comienza con una o más variables precursores y termina con una variable de salida final. Las variables dependientes son variables numéricas continuas o discretas.
Clasificación vs regresión | |
Un modelo de árbol donde la variable objetivo puede tomar un conjunto discreto de valores. | Un modelo de árbol donde la variable objetivo puede tomar los valores continuos típicamente números reales. |
Variable dependiente | |
Para el árbol de clasificación, las variables dependientes son categóricas. | Para el árbol de regresión, las variables dependientes son numéricas. |
Valores | |
Tiene una cantidad establecida de valores desordenados. | Tiene valores discretos pero ordenados o valores indiscretos. |
Propósito de la construcción | |
El propósito de construir el árbol de regresión es ajustar un sistema de regresión a cada rama determinante de manera que surja el valor de salida esperado. | Un árbol de clasificación se ramifica según lo determinado por una variable dependiente derivada del nodo anterior. |
Los árboles de regresión y clasificación son técnicas útiles para trazar el proceso que apunta a un resultado estudiado, ya sea en clasificación o un solo valor numérico. La diferencia entre el árbol de clasificación y el árbol de regresión es su variable dependiente. Los árboles de clasificación tienen variables dependientes que son categóricas y desordenadas. Los árboles de regresión tienen variables dependientes que son valores continuos o valores completos.
1."Aprendizaje de árboles de decisión." Wikipedia, Fundación Wikimedia, 13 de mayo de 2018. Disponible aquí
1.'Minería de datos' por Arbeck - Trabajo propio, (CC por 3.0) a través de Commons Wikimedia