Pequeño bestiario de los data sciences

Las siguientes descripciones e imágenes solo están destinadas a familiarizarse con el vocabulario y las representaciones que suelen utilizar los data scientists. No intente construir un buen esquema lógico a partir de esta información. Es suficiente con que enriquezca el número de asociaciones de ideas entre sus descubrimientos y sus conocimientos previos.

1. Los fundamentos

a. Aprendizaje y clasificación

Una máquina «aprende» cuando su configuración cambia según las circunstancias.

El aprendizaje supervisado es la aplicación más directa de este hallazgo. Después de recopilar la información, dividimos cada observación en dos partes, una que llamamos explicativa y la otra, explicada. Seguidamente, elegimos un mecanismo computacional que parece permitirnos deducir las variables explicadas a partir de las variables explicativas. 

El desarrollo de este modelo consiste, por tanto, en encontrar su configuración aparentemente más eficaz. Se dice que este proceso de aprendizaje está «supervisado» porque está bajo el control de las variables explicadas del conjunto de datos de entrenamiento.

Cuando recolectamos nuevas observaciones que solo tienen valores conocidos para las variables explicativas, basta con aplicar el modelo con sus parámetros para obtener lo que elegantemente se llama «predicción» o más simplemente «estimación».

Otras...

Si desea saber más, le proponemos el siguiente libro:
couv_EPT3DASR.png
60-signet.svg
Versión impresa
20-ecran_lettre.svg
Versión online
41-logo_abonnement.svg
En ilimitado con la suscripción ENI
130-boutique.svg
En la tienda oficial de ENI
Anterior
La dinámica de esta obra
Siguiente
Informática profesional y data sciences