Índice

Vocabulario y «tricks of the trade»

Sin duda, no puede ahorrarse el conocimiento de los siguientes temas durante su carrera como data scientist.

1. Complementos sobre las bases del machine learning

OLS: Ordinary least square (regression), es otra manera de llamar a la regresión lineal ordinaria por el método de los mínimos cuadrados que hemos abordado (LM) desde el principio del libro. OLS Ordinary least square

RM VS SRM: Empirical risk minimization designa la minimización de la función de riesgo sin regularización, Structural risk minization con regularización. L1 y L2 designan los tipos de regularizaciones que hemos visto en el libro. rm SRM Empirical risk minimization

La función indicatriz, que hemos introducido en el capítulo Técnicas y algoritmos imprescindibles, permite una gran compacidad en la expresión de ciertos problemas por ejemplo, k-NN tiene como objetivo: images/eq10104.PNG.

LOOCV: Leave-one-out cross validation, es un k-fold CV con k=n (preste atención, observe la variable del modelo atentamente). LOOCV Leave-one-out cross validation

PMF VS PDF: Probability mass function VS Probability density function (densidad de probabilidad): caso discreto vs. caso continuo para la densidad de una ley de probabilidad. PMF PDF Probability:mass function Probability:density function

CDF: Cumulative distribution function, es simplemente la función de reparto. Joint CDF (... conjunta) puede identificarse por:

images/eq10105.PNG

LSE: LogSumExp, utilizada en el LSE «trick», es una función ...