Python

Concatenar cadenas de texto en Python de forma óptima

La concatenación de cadenas de texto es una tarea habitual. Por eso en Python, al igual que otros lenguajes de programación, esta se puede realizar simplemente con el operador adicción +. Pero también existe un método de las cadenas de texto para esta tarea join. El cual permite concatenar cadenas de texto en Python de una forma más rápida y óptima para nuestros códigos.

Concatenar cadenas de texto en Python

La forma más popular para concatenar cadenas de texto en Python es el uso del operador adicción (+). Una forma que es fácil de usar al mismo tiempo que también se usa en muchos otros lenguajes de programación. Algo que se puede ver en el siguiente ejemplo.

str_1 = "Hola "
str_2 = "Python"

str_1 + str_2

'Hola Python'

Ahora bien, esta tarea también se puede hacer mediante el uso del método join que tienen todas las cadenas de texto. Por ejemplo, el caso anterior se puede repetir con el siguiente código.

''.join([str_1, str_2])

'Hola Python'

Ventajas de `join` sobre `+` concatenar

Si el operador adicción permite concatenar dos cadenas de texto de forma tan sencilla, ¿por qué existe el método join? Esto es así porque el operador + no es óptimo en tareas más complejas como la concatenación de varias cadenas de texto. Por ejemplo, si tenemos que concatenar las cadenas de texto de una lista sería necesario hacer algo como:

strs = ['Python', 'es', 'un', 'gran', 'lenguaje', 'de', 'programación']

result = ''
for s in strs:
    result += s + ' '
    
result = result[:-1]
result

'Python es un gran lenguaje de programación'

Lo que nos obliga a crear una variable result en la que almacenar los resultados intermedios, agregar en cada caso un carácter para separar las cadenas y, finalmente, eliminar el último separador que no es necesario. Algo que es mucho más fácil de implementar con el método join

' '.join(strs)

'Python es un gran lenguaje de programación'

Mejora del rendimiento

El uso del método join para concatenar cadenas de texto en Python no solo es una mejora en cuanto a facilidad de codificación, sino que representa una mejora del rendimiento. Algo que se puede comprobar repitiendo varias veces los ejemplos anteriores y midiendo el tiempo de ejecución. Así para el uso del operador + se puede usar:

%%time

for i in range(1000):
    result = ''
    for s in strs:
        result += s + ' '

    result = result[:-1]

CPU times: user 1.68 ms, sys: 24 µs, total: 1.7 ms
Wall time: 1.74 ms

Mientras que para el caso del método join se obtiene:

%%time

for i in range(1000):
    ' '.join(strs)

CPU times: user 433 µs, sys: 19 µs, total: 452 µs
Wall time: 520 µs

Pudiendo ver que en el primer caso el tiempo total de ejecución es de 1.7 ms, mientras que en el segundo es de 0,4 ms, lo que supone casi un factor 4. Algo a tener en cuenta cuándo esta es una tarea habitual.

El motivo de esto es que en nuestra primera operación es necesario crear y destruir una variable en memoria cada vez que concatena una cadena. Lo que hace que el proceso sea más lento y requiere más memoria que la segunda aproximación.

Conclusiones

En la entrada de hoy se ha visto las ventajas que tiene usar el método join para concatenar cadenas de texto en Python sobre el operador adicción (+). Quizás las ventajas no sean apreciables cuándo se usa el operador para generar una salida por pantalla, pero es bueno conocer la diferencia para el resto de los casos. Este resultado es algo que deberíamos tener en cuenta y agregar a nuestro arsenal de herramientas para el procesado de cadenas de texto en Python.

Imagen de Pexels en Pixabay