Filtrar una cadena de caracteres con el módulo re

Las funciones estándares para el tratamiento de las cadenas de caracteres que ofrece Python, son suficientes para las operaciones sencillas. Para tratamientos un poco más complicados, será necesario escribir expresiones regulares, compilarlas y compararlas a la o las cadenas de caracteres que deseamos analizar. Esto es lo que permite hacer el módulo re. Aunque no sea el tema del libro, esta sección aborda brevemente qué son las expresiones regulares y cómo se escriben.

En primer lugar, ¿qué es una expresión regular? Una expresión regular es una cadena de caracteres que describe un conjunto de cadenas de caracteres. Este conjunto define, respecto a un flujo de datos que normalmente es texto, lo que el programa debe o no filtrar.

Empecemos con ejemplos sencillos que se deberán ejecutar en REPL:


>>> import re  
>>> pattern = re.compile('abc')  
>>> pattern.match('ab')  
>>> pattern.match('bc')   
>>> pattern.match('abc')  
<_sre.SRE_Match object; span=(0, 3), match='abc'>
 

La llamada a la función re.compile() compila una expresión regular, también llamada pattern en inglés. Esta expresión regular representa el filtro que se debe aplicar a la cadena de caracteres que deseamos analizar. La expresión se aplica a continuación a la cadena ab, después...

Si desea saber más, le proponemos el siguiente libro:
couv_RITRASPYT.png
60-signet.svg
Versión impresa
20-ecran_lettre.svg
Versión online
41-logo_abonnement.svg
En ilimitado con la suscripción ENI
130-boutique.svg
En la tienda oficial de ENI
Anterior
Lanzar los comandos shell con el módulo subprocess
Siguiente
Escritura de scripts con el módulo argparse