Índice

Pequeño bestiario de las data sciences

Las descripciones e imágenes siguientes tienen como único objetivo familiarizarse con el vocabulario y las representaciones que utilizan a menudo los data scientists. No busque cómo construir una estructura lógica compleja a partir de esta información; conténtese con enriquecer el número de asociaciones de ideas entre sus descubrimientos y sus conocimientos previos.

1. Los fundamentos

a. Aprendizaje y clasificación

Una máquina «aprende» cuando su configuración evoluciona en función de las circunstancias.

El aprendizaje supervisado es la aplicación más directa de este fenómeno. Tras haber recopilado información, se divide cada observación en dos partes, una llamada explicativa y otra explicada. Se escoge, a continuación, una mecánica de cálculo que parece permitir deducir las variables explicadas a partir de las variables explicativas. La afinación de este modelo consiste en encontrar la configuración que resulte más eficaz. Este proceso de aprendizaje se llama «supervisado», puesto que está bajo el control de las variables explicadas del conjunto de datos de entrenamiento.

Cuando se recogen nuevas observaciones que no posean valores conocidos para las variables explicativas, basta con aplicar el modelo con sus parámetros para obtener lo que se denomina a su vez una predicción o, simplemente, una estimación.

Las demás formas ...