Índice

Principio

El lenguaje de programación awk es una utilidad adaptada al tratamiento de archivos de texto. Permite realizar acciones sobre registros de datos incluso estructurados en campos. El nombre "awk" tiene como origen las iniciales de cada uno de sus autores: Aho, Weinberger y Kernighan. Este capítulo presenta las funcionalidades principales de las recientes versiones del lenguaje awk, llamadas nawk (new awk) en varias plataformas Unix. En Linux, el comando awk es un enlace simbólico al intérprete gawk (GNU awk).

1. Sintaxis

awk [-F] ’{acción-awk}’ [ arch1 ... archn ] 
awk [-F] -f script-awk [ arch1 ... archn ]

El comando awk recibe como argumento la lista de archivos que se han de tratar. Ante la ausencia de archivos en la línea de comandos, awk trabaja con los datos que le lleguen por su entrada estándar. Por lo tanto, este comando puede ponerse después de una tubería de comunicaciones.

2. Variables especiales

a. Variables predefinidas a partir de la ejecución de awk

La tabla siguiente presenta las principales variables internas del lenguaje awk presentes en memoria desde el primer momento de su ejecución. El valor de estas variables puede modificarse, si se desea, en función de la estructura de datos que se han de tratar.

Nombre de la variable

Valor por defecto

Función de la variable

RS

Salto de línea (Newline) (\n)

Record Separator: carácter separador de registros (líneas).

FS

Serie de espacios o tabulaciones

Field Separator: ...