Programación de expresiones regulares

Actualmente la mayoría de los métodos de programación para búsqueda y limpieza utilizan expresiones regulares, porque estas les permiten encontrar cadenas de caracteres específicos y otras que cumplan ciertos padrones, como direcciones de correo, números telefónicos, nombres, entre muchas más, por eso es muy útil que sepas programarlo.

Requerimientos.

Los requerimientos para manejar las expresiones regulares en Python son las siguientes:

·         Archivo de texto con la información que se quiera limpiar o extraer.

·         Librería “re” para hacer uso de expresiones regulares.

·         Phyton 2.7 en adelante.

Para este ejemplo se tomará un archivo .html de una página de Internet y se filtrarán únicamente los correos electrónicos que esta contenga. Sigue estos pasos para utilizar expresiones regulares, también llamadas “redis” en Python:

·         Importa la librería para utilizar “redis”.

·         Lee el archivo de texto y carga su información a una variable.

·         Utiliza el método de re.findall de la librería para encontrar y guardar en un arreglo todas las cadenas de caracteres que coincidan con la expresión regular.

Este método recibe como parámetros la expresión regular seguida del texto en el que hará la búsqueda.

Para finalizar utiliza el método Len, para obtener el número de correos encontrados en tu archivo de texto. Con expresiones regulares podrás extraer y limpiar cualquier tipo de información, también te facilitan y reducen el tiempo de programación, además de que mejora sustancialmente el tiempo de procesamiento de tu programa.

Fuente:
Fundación Carlos Slim – Curso Analista de Datos.

Comentarios

Lo más popular de la semana

25 Preguntas de Economía

Cultura Olmeca

25 Preguntas de Ciencia y Tecnología