Índice

Buenas prácticas útiles

1. Trazar una curva ROC ROC (Receiver Operating Characteristic)

Hemos introducido la curva ROC y la noción de AUC en el primer capítulo. El concepto no es muy complicado, pero en ocasiones existen dificultades para trazar estas curvas de buenas a primeras. Son las cuervas esperadas por sus colegas; he aquí un código «hiperclásico» para producir una. AUC (Area Under the Curve)

Para fabricar nuestro conjunto de datos, hemos retomado el código LHS visto más arriba, pero con 300 observaciones en lugar de 100.

Nuestro ejemplo utiliza árboles de decisión. Hemos fabricado una función perturbada para producir clases binarias. Esta parte de código no presenta sorpresas.

require(caret)  
require(party)  
  
set.seed(1)                     
y <- 10*df[,1] +                      # una función extraña  
     7* df[,2] * rnorm(nrow(df))+   
     3*sin(df[,3])+  
     2*sin(df[,4])*runif(nrow(df))  
y <-  ifelse(y < 7,0,1)               # fabricación de clases   
sum(y)/length(y)                      # % clases  
y <-  factor(y)                       # creación ...