Feature Engineering, conceptos básicos Feature Engineering

Feature Engineering se podría traducir con algo de imaginación como ingeniería de datos y, con menos de 100 000 entradas en Google, podría parecer el pariente pobre del machine learning, con sus 20 millones de enlaces. Sin embargo, esto a menudo representa más de la mitad del esfuerzo necesario en un proyecto de data sciences.

1. Posicionamiento del problema

La Feature Engineering se refiere a las técnicas de ingeniería utilizadas para trabajar con los atributos del problema que se está estudiando, y representa uno de los aspectos más delicados de la data sciences.

De hecho, las features de un problema dado no siempre se muestran de forma natural y evidente.

Es normal que se necesite mucho esfuerzo para imaginar cuáles podrían ser los atributos correctos, crearlos, seleccionarlos, probarlos y transformarlos para hacerlos relevantes y digeribles por nuestros algoritmos. Las buenas predicciones requieren buenos atributos (en inglés predictors o features).

El trabajo de selección y configuración de los modelos, la medición de los errores de predicción (o de clasificación) y la cuidadosa interpretación de los resultados son tres elementos inseparables de la disciplina denominada Feature Engineering.

La idea general es refinar y transformar los datos sin procesar (data) para que nos proporcionen información enriquecida. Matemáticamente, esta ganancia o riqueza...

Si desea saber más, le proponemos el siguiente libro:
couv_EPT3DASR.png
60-signet.svg
Versión impresa
20-ecran_lettre.svg
Versión online
41-logo_abonnement.svg
En ilimitado con la suscripción ENI
130-boutique.svg
En la tienda oficial de ENI
Anterior
Enjambre (swarm)
Siguiente
PCA clásico, elementos matemáticos