Recientemente me han planteado cómo identificar triptongos en cadena de texto dentro de los elementos de una lista en Python. Siendo esta una tarea que se puede realizar fácilmente recurriendo a las expresiones regulares. Una herramienta tan poderosa y muchas veces olvidadas.
Para buscar un grupo de caracteres en una cadena de texto mediante expresiones regulares simplemente se tiene encerrar los válidos entre corchetes. Así para buscar las vocales solamente se tiene que escribir “[AEIOUaeiou]” o “[aeiou]” si se ignorar la diferencia entre mayúsculas y minúsculas.
Si queremos buscar tres vocales seguidas no hay más que concatenar tres “[aeiou][aeiou][aeiou]” y comprobar con una expresión regular si existe esta combinación.
re.search("[aeiou][aeiou][aeiou]", texto, re.IGNORECASE)
Observando que se ha usado la opción re.IGNORECASE
para indicar que no se debe diferenciar entre mayúsculas o minúsculas. Así para identificar diptongos o triptongos en una cadena de texto en Python se puede definir la siguiente función:
import re def multiple_string(list_, num=3): regex = num * "[aeiou]" for text in list_: if re.search(regex, text, re.IGNORECASE): print(text) multiple_string(['hola', 'antiautoritario', 'vieira', 'colores', 'GUAU'], 3)
antiautoritario vieira GUAU
En la que se ha definido como parámetros de entrada la lista y el número de caracteres que se desean buscar.
Al ejecutar el ejemplo se obtiene como resultado las palabras de la lista que contiene tres vocales consecutivas. Siendo esto lo que se buscaba inicialmente.
En este caso se puede simplificar el código si se utiliza programación funcional. Por ejemplo, se puede filtrar la lista con:
def multiple_string(list_, num=3): regex = num * "[aeiou]" return list(filter(lambda text: re.search(regex, text, re.IGNORECASE), list_)) multiple_string(['hola', 'antiautoritario', 'vieira', 'colores', 'GUAU'], 3)
['antiautoritario', 'vieira', 'GUAU']
En esta entrada se ha visto la utilidad de las expresiones regulares para identificar patrones en cadenas de texto. Una tarea que es bastante habitual. Además se ha visto como la programación funcional permite hacer código más sencillo de leer y comprender.
Imágenes: Pixabay (Theodor Moise )
En ciencia de datos y estadística, los promedios y porcentajes son herramientas fundamentales para resumir…
Las bases de datos son el corazón de casi cualquier sistema de información moderno. Ya…
En ciencia de datos, pocas cosas llaman más la atención de los científicos de datos…
Calcular adecuadamente el tamaño de la muestra es una parte esencial en el diseño de…
Hoy en día, cuando pensamos en ciencia de datos, lo primero que nos viene a…
Ampliar el espacio de almacenamiento en un sistema Linux es una tarea habitual y crítica…
This website uses cookies.