Índice

Construir la caja de herramientas

A modo de introducción a este capítulo, enumeraremos de forma breve aquellos elementos difícilmente prescindibles para poder trabajar con los datos en R y obtener cualquier cosa:

  • Un panel de técnicas de visualización para comprender los datos, preparar la acción y controlar visualmente el resultado del trabajo realizado.

  • Puntos de referencia teóricos para orientarse entre las distintas opciones técnicas, algunos algoritmos buenos de clasificación, de regresión y de clustering para apoyarse en ellos.

Esto constituye, más o menos, el conjunto de este capítulo.

De hecho, tras abordar los capítulos anteriores, disponemos ahora de un kit de herramientas bastante respetable sobre ciertos asuntos:

  • Relativo al aspecto gráfico: plots, diagramas por pares, histogramas, densidad, diagramas de caja, «facet» por clase, 3D, curvas de nivel/contornos, visualización interactiva multiventana...

  • Relativo a la clasificación y la regresión: indicadores y pruebas diversas, árbol de decisión, regresión lineal multivariable y Random Forest.

Exploremos ahora algunas técnicas complementarias a las que ya hemos estudiado. Esta elección es empírica, los elementos se han seleccionado basándose en uno o varios de los siguientes tres criterios:

  • Comportar un aspecto didáctico.

  • Tener una utilidad práctica.

  • Ser un conocimiento compartido con los demás practicantes.