Construir su caja de herramientas

Como introducción a este capítulo, vamos a enumerar brevemente lo que es difícil de hacer sin trabajar sus datos con R y sacar algo de ello:

  • Un panel de técnicas de visualización para comprender los datos, preparar la acción y controlar visualmente el resultado de su trabajo.

  • Puntos de referencia teóricos para orientarse en las elecciones técnicas, algunos buenos algoritmos de clasificación, regresión y agrupamiento.

Este es prácticamente el plan de este capítulo.

De hecho, gracias a los capítulos anteriores, ya tenemos un kit muy respetable sobre algunos de estos aspectos:

  • En relación con el aspecto gráfico: plots, diagramas por pares, histogramas, densidad, diagramas de caja, «facetas» por clase, 3D, curvas de nivel/contorno, visualización interactiva multiventana, etc.

  • Respecto a la clasificación y regresión: varios indicadores y pruebas, árbol de decisión, regresión lineal multivariante y Random Forest.

  • Y como extra adicional, muchas técnicas que le permiten dar forma a los datos como desee: leer archivos CSV procesando los datos ausentes, transformar columnas y filas, seleccionar, ordenar y agregar filas, realizar numerosos cálculos para comprender los datos, manipular datos textuales, etc.

Ahora vamos a explorar técnicas complementarias a las que ya hemos estudiado. Esta elección es completamente empírica y los elementos se seleccionan de acuerdo...

Si desea saber más, le proponemos el siguiente libro:
couv_EPT3DASR.png
60-signet.svg
Versión impresa
20-ecran_lettre.svg
Versión online
41-logo_abonnement.svg
En ilimitado con la suscripción ENI
130-boutique.svg
En la tienda oficial de ENI
Anterior
Puesta en práctica: aprendizaje supervisado
Siguiente
Representación gráfica de los datos