Python

Concatenar cadenas de texto en Python de forma óptima

La concatenación de cadenas de texto es una tarea habitual. Por eso en Python, al igual que otros lenguajes de programación, esta se puede realizar simplemente con el operador adicción +. Pero también existe un método de las cadenas de texto para esta tarea join. El cual permite concatenar cadenas de texto en Python de una forma más rápida y óptima para nuestros códigos.

Concatenar cadenas de texto en Python

La forma más popular para concatenar cadenas de texto en Python es el uso del operador adicción (+). Una forma que es fácil de usar al mismo tiempo que también se usa en muchos otros lenguajes de programación. Algo que se puede ver en el siguiente ejemplo.

str_1 = "Hola "
str_2 = "Python"

str_1 + str_2
'Hola Python'

Ahora bien, esta tarea también se puede hacer mediante el uso del método join que tienen todas las cadenas de texto. Por ejemplo, el caso anterior se puede repetir con el siguiente código.

''.join([str_1, str_2])
'Hola Python'

Ventajas de join sobre + concatenar

Si el operador adicción permite concatenar dos cadenas de texto de forma tan sencilla, ¿por qué existe el método join? Esto es así porque el operador + no es óptimo en tareas más complejas como la concatenación de varias cadenas de texto. Por ejemplo, si tenemos que concatenar las cadenas de texto de una lista sería necesario hacer algo como:

strs = ['Python', 'es', 'un', 'gran', 'lenguaje', 'de', 'programación']

result = ''
for s in strs:
    result += s + ' '
    
result = result[:-1]
result
'Python es un gran lenguaje de programación'

Lo que nos obliga a crear una variable result en la que almacenar los resultados intermedios, agregar en cada caso un carácter para separar las cadenas y, finalmente, eliminar el último separador que no es necesario. Algo que es mucho más fácil de implementar con el método join

' '.join(strs)
'Python es un gran lenguaje de programación'

Mejora del rendimiento

El uso del método join para concatenar cadenas de texto en Python no solo es una mejora en cuanto a facilidad de codificación, sino que representa una mejora del rendimiento. Algo que se puede comprobar repitiendo varias veces los ejemplos anteriores y midiendo el tiempo de ejecución. Así para el uso del operador + se puede usar:

%%time

for i in range(1000):
    result = ''
    for s in strs:
        result += s + ' '

    result = result[:-1]
CPU times: user 1.68 ms, sys: 24 µs, total: 1.7 ms
Wall time: 1.74 ms

Mientras que para el caso del método join se obtiene:

%%time

for i in range(1000):
    ' '.join(strs)
CPU times: user 433 µs, sys: 19 µs, total: 452 µs
Wall time: 520 µs

Pudiendo ver que en el primer caso el tiempo total de ejecución es de 1.7 ms, mientras que en el segundo es de 0,4 ms, lo que supone casi un factor 4. Algo a tener en cuenta cuándo esta es una tarea habitual.

El motivo de esto es que en nuestra primera operación es necesario crear y destruir una variable en memoria cada vez que concatena una cadena. Lo que hace que el proceso sea más lento y requiere más memoria que la segunda aproximación.

Conclusiones

En la entrada de hoy se ha visto las ventajas que tiene usar el método join para concatenar cadenas de texto en Python sobre el operador adicción (+). Quizás las ventajas no sean apreciables cuándo se usa el operador para generar una salida por pantalla, pero es bueno conocer la diferencia para el resto de los casos. Este resultado es algo que deberíamos tener en cuenta y agregar a nuestro arsenal de herramientas para el procesado de cadenas de texto en Python.

Imagen de Pexels en Pixabay

¿Te ha parecido de utilidad el contenido?

Daniel Rodríguez

Share
Published by
Daniel Rodríguez

Recent Posts

Curiosidad: La Paradoja de Simpson, o por qué no siempre debes fiarte de los promedios

En ciencia de datos y estadística, los promedios y porcentajes son herramientas fundamentales para resumir…

22 horas ago

Copias de seguridad automáticas en SQL Server con rotación de archivos

Las bases de datos son el corazón de casi cualquier sistema de información moderno. Ya…

3 días ago

Curiosidad: La Ley de Twyman y la trampa de los datos “interesantes”

En ciencia de datos, pocas cosas llaman más la atención de los científicos de datos…

1 semana ago

Cómo calcular el tamaño de la muestra para encuestas

Calcular adecuadamente el tamaño de la muestra es una parte esencial en el diseño de…

1 semana ago

Curiosidad: El origen del análisis exploratorio de datos y el papel de John Tukey

Hoy en día, cuando pensamos en ciencia de datos, lo primero que nos viene a…

2 semanas ago

Cómo extender el tamaño de un disco en Rocky Linux 9 usando growpart y LVM

Ampliar el espacio de almacenamiento en un sistema Linux es una tarea habitual y crítica…

2 semanas ago

This website uses cookies.