Índice

Manipulación de los datos

1. Lectura de los datos: fundamentos

Para realizar sus manipulaciones básicas, los archivos que utiliza son, a menudo, archivos .csv (se trata de un formato de exportación habitual de muchas aplicaciones, entre ellas Excel).

Para cargar dichos archivos, hay que definir los separadores de los campos, el símbolo que codifica la coma decimal, si existen o no los títulos de las columnas, los caracteres que se corresponden con los datos que faltan y el tipo de codificación del archivo (habitualmente UTF8). Si no dispone de esta información, puede realizar sucesivos intentos y converger rápidamente a una lectura eficaz de su archivo. A menudo basta con abrir el archivo con un editor como Emacs o Notepad++ para saber qué se trae uno entre manos.

He aquí un código típico, que va a leer un archivo que encontrará en el sitio que acompaña a este libro.

## Leer los datos                                              ## 
  
data <- read.csv("datatest1.csv",   
               sep=";",   
               dec=",",   
               na.strings=c(".", "NA", "", "?","#DIV/0!"),   
             ...