Resalte de las diferencias entre las distribuciones Distribución

Ahora intentaremos resaltar (o no) las posibles diferencias en las distribuciones para ciertas variables de aspecto gaussiano (para este ejemplo, hemos elegido glucose) entre la distribución con diabetes o sin ella.

Nuestra principal preocupación será la importancia de cualquier diferencia en la media. La herramienta también nos aporta información sobre la diferencia en la desviación típica, que no requiere una interpretación fuerte, sino que el hecho de que sea significativa puede reforzar la idea de que un algoritmo bien elegido podrá mejorar la predictibilidad de diabetes

library(lessR) 
d <- df                         # por defecto lessR utiliza d como dataset 
tt.brief(glucose ~ diabetes)   # gráfico y estados 
images/EP14-090.png

Distribuciones de la glucosa en función de la diabetes

La diferencia en la media es significativa

También es posible que desee una representación de «bigote/violín», utilizando la siguiente sintaxis:

library(ggstatsplot) 
 
set.seed(666) 
ggbetweenstats( 
 data = df, 
 x = diabetes, 
 y = glucose, 
 title = "Distribución de la glucosa con o sin diabetes" 
) 
images/cap14_pag12a.png

Diagrama de bigotes/violín comparado

También podemos representar dos variables y sus distribuciones condicionales:...

Si desea saber más, le proponemos el siguiente libro:
couv_EPT3DASR.png
60-signet.svg
Versión impresa
20-ecran_lettre.svg
Versión online
41-logo_abonnement.svg
En ilimitado con la suscripción ENI
130-boutique.svg
En la tienda oficial de ENI
Anterior
Dependencia lineal entre variables
Siguiente
Puntos atípicos