Trucos y pequeños consejos

1. Sobre las pruebas

Las pruebas no paramétricas son menos potentes, pero menos exigentes en términos de condiciones sobre las distribuciones de variables.

Antes de aplicar la R de Pearson (test paramétrico) o la R de Spearman (test no paramétrico), hay que comprobar que al menos una de las dos variables sigue una distribución normal. R de Pearson Prueba:paramétrica R de Spearman

Piense en la prueba de Kruskal-Wallis (no paramétrica) para verificar una posible dependencia entre una variable numérica y otra cualitativa multiclase. Prueba:de Kruskal-Wallis No paramétrica

Piense en la prueba de Kolmogorov-Smirnov: ¿son estas dos distribuciones empíricas similares o no? ¿Esta distribución empírica se corresponde con una distribución dada (este último punto es particularmente útil)? Prueba:de Kolmogorov-Smirnov

La prueba de normalidad de Shapiro-Wilk a menudo es una excelente opción.

2. Gestión de las variables

Los coeficientes de una regresión dependen de las unidades; al normalizar sus datos, puede comparar mejor la influencia de una variable en el conjunto. Si tiene problemas con el acondicionamiento de matrices (sensibilidad a pequeñas variaciones, matrices singulares), esto podría sacarlo de un apuro.

Selección de variables paso a paso: al agregar las características paso a paso a su modelo, obtiene una mejor idea de su influencia. Si utiliza métodos dedicados a esto...

Si desea saber más, le proponemos el siguiente libro:
couv_EPT3DASR.png
60-signet.svg
Versión impresa
20-ecran_lettre.svg
Versión online
41-logo_abonnement.svg
En ilimitado con la suscripción ENI
130-boutique.svg
En la tienda oficial de ENI
Anterior
Distancias
Siguiente
Paquetes y temas para estudiar