Python es uno de los lenguajes de programación más populares de la actualidad. Lo que se puede apreciar es los diferentes tipos de desarrollos en los que se suele utilizar: la inteligencia artificial, el análisis de datos o la creación de páginas web. Pero tiene un problema, el código Python es lento en comparación con lenguajes compilados como C. Un problema que se puede solucionar traduciendo el código Python a C y compilándolo con Cython. Pendiendo obtener así considerables mejoras del rendimiento. En esta entrada se explicará cómo se puede aumentar el rendimiento de Python con Cython.
Cython
La forma más fácil de aumentar la velocidad de una función escrita en Python es volver a escribir esta en C y compilarla. Pero C no es tan fácil como el de Python. Para esto es lo que existe Cython, una librería que, con pequeñas modificaciones, permite traducir código Python a C y compilarlo.
El único ajuste que es necesario hacer Cython es indicar el tipo de dato de todas las variables y funciones. Para lo que se utiliza la instrucción def
(para utilizar desde Python), cdef
(para utilizar desde Cython) o cpdef
(para utilizar desde Python y Cython) seguida del tipo de dato. Por ejemplo, en Python para crear una variable entera se tiene que escribir
i = 1
A la hora de usar Cython se tiene que escribir
cpdef int i = 1
Los tipos de datos soportados por Cython los estándar de C/C++: int
, char
, floar
, double
, list
, dict
y object
.
Instalación de Cython
La instalación de Cython se realiza mediante pip escribiendo la instrucción:
pip install cython
Una vez instalado ya se puede proceder a su uso.
La sucesión de Fibonacci
Para comprobar cuánto puede mejorar el rendimiento del código Python al utilizar Cython se puede utilizar la sucesión de Fibonacci. La cual la hemos utilizado en anteriormente para comparar el rendimiento de Python con Julia. Esta función en Python se puede implementar mediante el siguiente código:
def fibonacci(n): if n < 2: return n else: return fibonacci(n-1) + fibonacci(n-2)
La sucesión de Fibonacci con Cython
El código Python solamente necesita que se le indique el tipo de la variable y la función. En este caso enteros. Además, como la función se quiere utilizar tanto desde Python como Cython se ha de cambiar def
por cpdef
. Quedando el código de la siguiente forma.
cpdef int fibonacci(int n): if n < 2: return n else: return fibonacci(n-1) + fibonacci(n-2)
Ahora este código se tiene que guardar en un archivo con extensión pyx
y es necesario compilarlo. En nuestro caso se guardará en un archivo con el nombre fibonacci_cython.pyx
.
Compilación del código Cython
Una vez guardada la función en un archivo es necesario crear un script Python para compilar el código. Este archivo debe contener las siguientes líneas de código.
from distutils.core import setup from Cython.Build import cythonize setup(ext_modules = cythonize('fibonacci_cython.pyx'))
Una vez guardado el script en un archivo se tiene que ejecutar este. Para esto es necesario utilizar el siguiente comando.
python compile.py build_ext --inplace
Si todo va bien se generará un archivo con extensión c
con el código traducido a C y otro archivo con el compilado.
Medir el aumento el rendimiento
Para saber cuánto puede aumentar el rendimiento de Python cuando se utiliza Cython solamente se tiene que comparar el tiempo que tarda en ejecutarse ambas implementaciones de la sucesión de Fibonacci. Para ello se puede usar el siguiente código.
import timeit import fibonacci_cython py = timeit.timeit("fibonacci(30)", "from __main__ import fibonacci", number=30) cy = timeit.timeit("fibonacci(30)", "from fibonacci_cython import fibonacci", number=30)
En este se mide cuánto tiempo tarda en calcular el valor la sucesión de Fibonacci para 30 repitiendo el proceso 50. En el mismo ordenador la implementación en Python ha tardado 14 segundos, mientras que la de Cython 0.20 segundos. Lo que significa un aumento del rendimiento en un factor 70.
Podemos recordar que cuando se utilizó la sucesión de Fibonacci para comparar la diferencias de rendimiento entre Julia y Python la diferencia entre estos era un factor de 80. Por lo que en el caso de utilizar Cython se puede obtener un rendimiento similar al de Julia en la sucesión de Fibonacci.
Conclusiones
El rendimiento del código es siempre un asunto importante. Por lo que poder mejorar el rendimiento de este en más de un orden de magnitud es algo que nos permite ser más productivos. Esto es justamente lo que ofrece Cython, poder aumentar el rendimiento de Python considerablemente.
En cierta medida Cython es similar al paquete Rcpp de R. Pero en este caso Cython no es necesario saber programar en C para aumentar el rendimiento de Python, ya que la traducción es también automática.
Imágenes: Pixabay (WikiImages)
josh dice
como paso librerias de python a cython digamos matplotlib a cython?
Daniel Rodríguez dice
La mayoría de las librerías se pueden usar con Cython sin mayores problemas. Hay que pensar en Cython como una herramienta para que nuestro código Python se ejecute de forma más eficiente no para recompilar librerías.
Cesar dice
La libreria de matplotlib esta escrita en C , igual que pandas o numpy