loader

REgex y aplicaciones

REgex es una abreviación para Regular Expression (expresiones regulares). El REgex es un patrón de caracteres que se utilizan para buscar un texto específico o una porción de texto.

El fin del regex generalmente es buscar coincidencias de texto y/o realizar reemplazos sobre este texto. Cuando se trabaja con un documento de texto grande o un archivo de log extenso. El REgex permite realizar rapidamente una búsqueda del patrón que necesitemos.

Lo primero que necesitamos entender es que cada letra, número y símbolo es un carácter. Un string se compone de varios caracteres para formar palabras o claves.

En REgex se utilizan diferentes símbolos para identificar el patrón que buscamos.

Por ejemplo:

 \d  nos permite buscar cualquier número de 0 a 9.
 \D hará Match con cualquier carácter que no sea un número.

Una de las mejores herramientas con las que me he encontrado para probar códigos REgex es: https://regexr.com/

Probando el ejemplo de arriba:

En la imagen de la izquierda el Regex hizo Match con el primer número que encontró. En la del centro, con 3 números seguidos. Y en la derecha, con el primer carácter que no era numérico.

La herramienta permite hacer pruebas en tiempo real, seleccionando el texto que coincida con la expresión regex que pongamos como input.

Regex posee varias herramientas de identificación de texto. Lo importante es comprender su sintaxis. Existen varias maneras de buscar un mismo conjuntos de caracteres. Y depende de cada uno buscar la manera más fácil de conseguirlo.

Ya que en Regex los símbolos del teclado tienen u propio significado, es imperativo utilizar un ‘carácter de escape’ para poder buscar un símbolo.
Si nuestra expresión busca un punto (.) necesitamos utilizar la siguiente sintaxis: \.
De lo contrario el punto (.) por si solo se utiliza en regex para buscar ‘cualquier carácter’.

Otro ejemplo importante son los grupos inclusivos y exclusivos. Para esto se hace el uso de llaves rectas [ ].

En este ejemplo notamos que solo los caracteres abcfjusz son seleccionados sin importar el orden en el que se encuentren entre las llaves rectas.

De igual manera el símbolo (^) para negar un set de datos. Tomando en consideración el ejemplo anterior:

Negar el conjuntos anterior nos permite seleccionar todos las caracteres excepto por el conjunto entre llaves rectas.

A continuación adjunto una lista de la sintaxis junto con un link a una página que provee ejercicios de REgex para practicar.

1 thought on “REgex y aplicaciones

  1. ExoRank.com enero 29, 2020   4:01 pm Responder

    Awesome post! Keep up the great work! 🙂

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

es_ES
en_US es_ES