Índice

GAM: generalización de LM/GLM GAM GLM (Generalized Linear Model)

Para ir más lejos con el modelo lineal vamos a estudiar su generalización, que forma parte, por motivos evidentes, del conjunto de herramientas de muchos data scientists.

El Modelo:aditivo generalizadomodelo aditivo generalizado (GAM) va más allá que el modelo GLM en la generalización de los modelos lineales, de modo que debería tenerlo en cuenta desde el inicio de su trabajo.

Se trata de un modelo muy manejable, con grandes posibilidades, eficaz en términos de rendimiento, cuyas cualidades pueden incitar a comportamientos de sobreajuste, pero que permite hacer lo que podríamos denominar un «traje a medida» sobre los datos. Aunque es también un modelo que nos incita a comprender y analizar nuestros datos y que resulta muy interesante desde una óptica audaz y exploratoria.

En el modelo lineal común, imaginamos que la variable de respuesta y es una ley normal de media images/eq40.png y de varianza images/eq1001.PNG con: images/eq1002.PNG
En el modelo GLM, se presentan otros conceptos, pero manteniendo la linealidad sobre los coeficientes images/eq1003.PNG, ¡que son los parámetros que hay que descubrir!

En este modelo, la variable de respuesta no puede corresponderse con una distribución normal, sino que debe formar parte de la «gama» de distribuciones de la «familia exponencial» que comprende, entre otras, las siguientes distribuciones: Normal, Normal multivariante, Log-Normal, inversa Gaussiana, Gamma, Gamma-Normal, Gamma-inversa, Exponencial, ...