Estrategias en función de la naturaleza de los datos

Las primeras estrategias aquí descritas corresponden al uso de modelos lineales (lm, glm, gam...).

1. Conteos

Aquí los datos son conteos (enteros positivos): número de accidentes, número de días de ola de calor, número de impactos, etc.

El valor 0 es un valor como cualquier otro, pero cuyo significado no se debe cambiar usando una transformación.

Los modelos lineales pueden producir valores negativos, la varianza de la variable de respuesta es una función creciente de la media. Valor:negativo

Vimos más atrás que, en este caso, debemos pensar en «Poisson».

El trabajo sobre las frecuencias también puede ser fructífero (ver las proporciones). Frecuencias

Si la variable de respuesta es un conteo, podemos tener grandes problemas de dispersión, por lo que podemos probar quasipoisson (o negativa binomial). Conteo quasipoisson negativa binomial

2. Proporciones

Aquí manipulamos ratios: tasa de mortalidad, tasa de respuesta, tasa de recuperación, distribución de una clase en una población, etc.

Tenga en cuenta que, en este caso, no sabemos el número de eventos (esto es lo que provoca parte de la dificultad).

En este caso, pensamos en binomial o quasibinomial (pero el problema no es tan sencillo). binomial quasibinomial

Las transformaciones (como log) algunas veces son muy útiles aquí. log

3. Variable de respuesta binaria

Aquí solo tenemos dos clases: masculino/femenino...

Si desea saber más, le proponemos el siguiente libro:
couv_EPT3DASR.png
60-signet.svg
Versión impresa
20-ecran_lettre.svg
Versión online
41-logo_abonnement.svg
En ilimitado con la suscripción ENI
130-boutique.svg
En la tienda oficial de ENI
Anterior
Fórmulas
Siguiente
Filtros (sobre imágenes)