Los números aleatorios son importantes en muchas aplicaciones. Desde las más básicas como puede ser seleccionar una carta al azar hasta para la creación de simulaciones de Montecarlo. La generación de números aleatorios se basa en una semilla a partir de la cual se crear una serie. En Python, como en otros lenguajes de programación, es posible fijar el valor para obtener los mismos números “aleatorios” cada vez que se ejecute el código. Lo cual es necesario cuando deseamos obtener los mismos resultados en un proceso que requiere números “aleatorios”. Por ejemplo, al realizar un proceso de muestreo de datos. En esta entrada se verá cómo fijar la semilla de los números aleatorios en Python.
Números aleatorios en un ordenador
En primer lugar, hemos de saber que los ordenadores no pueden producir números aleatorios en base a un algoritmo. Lo único que se puede obtener son números pseudoaleatorios. Para obtener números realmente aleatorios es necesario muestrear algún parámetro físico cuyo valor sea realmente aleatorio, como puede ser el número de desintegraciones radiactivas.
Las series de números aleatorios que generan los ordenadores no son más que secuencia deterministas a partir de un valor inicial, al que se llama semilla. En la mayoría de las aplicaciones estas series se parecen suficientemente a números aleatorios. Por lo que no es un problema su utilización. Es importante notar que al fijar la semilla se fija completamente los valores de toda la serie. Lo que hace este valor importante en múltiples casos.
En caso de que sea necesario generar una serie de números aleatorios y no se desea conocer la serie simplemente se ha de fijar una semilla aleatoria. Por ejemplo, utilizando el reloj.
Fijar la semilla de números aleatorios en Python
En Python para trabajar con números aleatorios es necesario importar la librería random
. En esta los números pseudoaleatorios se generan mediante la función random.random()
. Cada vez que se ejecute esta se obtendrá un número diferente, salvo que se vuelva a fijar la semilla. Para fijar la semilla se utiliza la función random.seed(seed_value)
, donde seed_value
es el valor que se desea utilizar.
En el siguiente código se puede ver cómo se fija la semilla a 0 y tras esto se obtienen tres número que parecen aleatorios. Posteriormente se vuelve a fijar la semilla a 0 para obtener la misma serie.
import random random.seed(0) print("Serie #1:", random.random(), random.random(), random.random()) random.seed(0) print("Serie #2:", random.random(), random.random(), random.random())
Serie #1: 0.8444218515250481 0.7579544029403025 0.420571580830845
Serie #2: 0.8444218515250481 0.7579544029403025 0.420571580830845
Esto se puede utilizar para implementar un proceso basado en números aleatorios donde sea necesario poder reproducir los resultados.
Aunque no es habitual, se puede el estado de la serie aleatoria para reproducir los resultados. En el siguiente código se muestra como obtener el estado con random.getstate()
para generar dos veces la misma serie aleatoria.
state = random.getstate() print("Serie #1:", random.random(), random.random(), random.random()) random.setstate(state) print("Serie #2:", random.random(), random.random(), random.random())
Serie #1: 0.25891675029296335 0.5112747213686085 0.4049341374504143
Serie #2: 0.25891675029296335 0.5112747213686085 0.4049341374504143
Es importante notar que la variable state
del ejemplo no contiene un número entero, sino que el estado interno de la serie.
Fijar la semilla de números aleatorios en NumPy
Al utilizar Python para ciencia de datos es habitual trabajar con la librería NumPy. Esta contiene su propio generador de número aleatorios que se puede acceder mediante la función np.random.rand()
. De forma análoga a lo visto anteriormente la semilla se puede fijar np.random.seed()
. Una ventaja del generador de número aleatorios de NumPy es la posibilidad de obtener un vector en lugar de un escalar. Por ejemplo, para obtener tres números como en el caso anterior se puede utilizar el siguiente código.
import numpy as np np.random.seed(0) print("Serie #1:", np.random.rand(3)) np.random.seed(0) print("Serie #2:", np.random.rand(3))
Serie #1: [0.5488135 0.71518937 0.60276338]
Serie #2: [0.5488135 0.71518937 0.60276338]
Aunque también se pueden obtener escalares y matrices.
print("Escalar:", np.random.rand()) print("Vector:", np.random.rand(3)) print("Matriz:", np.random.rand(3, 3))
Escalar: 0.5448831829968969
Vector: [0.4236548 0.64589411 0.43758721]
Matriz: [[0.891773 0.96366276 0.38344152]
[0.79172504 0.52889492 0.56804456]
[0.92559664 0.07103606 0.0871293 ]]
En NumPy también se puede recuperar el estado del generador de números aleatorios y usarlo para volver a generar la misma serie. En esta ocasión el estado se recupera con la función np.random.get_state()
. A diferencia del la librería random de Python en esta ocasión no se puede utilizar np.random.seed()
para volver a fijar el estado, sino que es necesario utilizar np.random.set_state()
. Esto es lo que se muestra en el siguiente código.
state = np.random.get_state() print("Serie #1:", np.random.rand(3)) np.random.set_state(state) print("Serie #2:", np.random.rand(3))
Serie #1: [0.0202184 0.83261985 0.77815675]
Serie #2: [0.0202184 0.83261985 0.77815675]
Al igual que en el caso anterior, state
no es un número entero.
Conclusiones
En esta entrada se ha visto cómo fijar la semilla de números aleatorios en Python y NumPy. Además, se ha explicado que los ordenadores no pueden producir números aleatorios sin una base física para ello. Al ser los números aleatorios, o de forma más correcta pseudoaleatorios, tan importantes comprender esto es importante.
Saber gestionar los números aleatorios que se utilizan en nuestras aplicaciones es importante. Ya que esta es la única manera de poder reproducir los resultados obtenidos en simulaciones y otros procesos. Por eso conocer cómo fijar la semilla de números aleatorios en Python, como también lo es en R, es clave para nuestro trabajo.
Imágenes: Pixabay (skeeze)
Deja una respuesta