Índice

Estrategias según la naturaleza de los datos

Las primeras estrategias descritas aquí se corresponden con el uso de modelos lineales (lm, glm, gam...).

1. Recuentos

Aquí los datos son recuentos (de enteros positivos): número de accidentes, número de días de ola de calor, número de impactos...

El valor 0 es un valor como cualquier otro, de modo que no hace falta cambiarle el sentido mediante una transformación.

Los modelos lineales pueden producir Valores negativosvalores negativos, la varianza de la variable de respuesta es una función creciente de la media.

Hemos visto antes que hay que pensar en «Poisson» en este caso.

El trabajo sobre las Frecuenciasfrecuencias puede resultar fructífero como complemento (ver las proporciones).

Si la variable de respuesta es una cuenta, podemos tener grandes problemas de dispersión, y podemos probar quasipoisson (o negativ binomial) negativ binomial. Recuento quasipoisson

2. Proporciones

Aquí, se manipulan relaciones: tasa de mortalidad, tasa de respuesta, tasa de curación, reparto de una clase en una población...

Observe que en este caso no se conoce el número de eventos (eso crea parte de la dificultad).

En este caso, pensamos en binomial o quasibinomial (aunque el problema no es para nada sencillo). binomial quasibinomial

En ocasiones, las transformaciones (como log) resultan muy útiles aquí. log

3. Variable de respuesta binaria

Aquí tenemos solamente dos clases: hombre/mujer, 0-1...

Hemos visto ...