Trucos y pequeños consejos
1. Sobre las pruebas
Las pruebas no paramétricas son menos potentes, pero menos exigentes en términos de condiciones sobre las distribuciones de variables.
Antes de aplicar la R de Pearson (test paramétrico) o la R de Spearman (test no paramétrico), hay que comprobar que al menos una de las dos variables sigue una distribución normal. R de Pearson Prueba:paramétrica R de Spearman
Piense en la prueba de Kruskal-Wallis (no paramétrica) para verificar una posible dependencia entre una variable numérica y otra cualitativa multiclase. Prueba:de Kruskal-Wallis No paramétrica
Piense en la prueba de Kolmogorov-Smirnov: ¿son estas dos distribuciones empíricas similares o no? ¿Esta distribución empírica se corresponde con una distribución dada (este último punto es particularmente útil)? Prueba:de Kolmogorov-Smirnov
La prueba de normalidad de Shapiro-Wilk a menudo es una excelente opción.
2. Gestión de las variables
Los coeficientes de una regresión dependen de las unidades; al normalizar sus datos, puede comparar mejor la influencia de una variable en el conjunto. Si tiene problemas con el acondicionamiento de matrices (sensibilidad a pequeñas variaciones, matrices singulares), esto podría sacarlo de un apuro.
Selección de variables paso a paso: al agregar las características paso a paso a su modelo, obtiene una mejor idea de su influencia. Si utiliza métodos dedicados a esto...