Python

Elementos aleatorios con y sin repetición en Python

La selección de elementos aleatorios a partir de una lista es una tare clave para múltiples situaciones. Siendo una de las primeras fases en algunos de los análisis de datos más habituales. Por eso en la librería estándar de Python existen funciones con las que se puede obtener elementos aleatorios con y sin repetición. Existiendo incluso para barajar las listas. Funciones que explicaremos a continuación.

Elementos sin repetición

La primera tarea que nos podemos plantear es cómo obtener elementos aleatorios de una lista sin repetición. En Python esto se puede hacer fácilmente con la función sample de la librería random. Una función a la que solamente se le tiene que pasar una lista como primer parámetro y el número de elementos que se desea obtener como segundo. Por ejemplo, para seleccionar dos colores de una lista solo se tiene que escribir:

import random

colors = ["R", "G", "B"]

random.sample(colors, 2)
['R', 'B']

El número de elementos tiene que se menor o igual al tamaño de la lista. Ya que en caso contrario se obtendrá un error a la hora de ejecutar la función.

Elementos con repetición

Si a partir de una lista se desea obtener una lista aleatoria donde los valores se pueden repetir se puede usar la función choises que se introdujo en la versión 3.6 de Python. A esta función se le tiene que pasar una lista y, mediante el parámetro k, el número de registros que se desea obtener. Así para obtener aleatoriamente cuatro colores de la lista anterior solamente se tiene que escribir.

random.choices(colors, k=4)
['B', 'R', 'B', 'R']

La segunda propiedad de esta función permite indicar el peso de cada uno de los elementos. Así si se desea que alguno de los elementos aparezcan con mayor frecuencia que el resto solamente se puede indicar aquí. Por ejemplo, si deseamos que ’R’ aparece 5 veces más que el resto se puede conseguir con el siguiente código.

random.choices(colors, [5, 2, 1], k=10)
['R', 'G', 'R', 'R', 'G', 'R', 'R', 'G', 'R', 'G']

En dónde se puede ver que ’R’ aparece 6 veces de 10, ’G’ aparece 4 de 10 y ’B’, el color con menor peso no aparece. Como se puede apreciar en el ejemplo en este caso se pueden seleccionar más elementos de los que existen en la lista inicial sin problemas.

Barajar una lista

Finalmente, otra función interesante es shuffle. Con la que se puede barajar listas, no tuplas ya que estas no son mutables. Con esta función hay que tener cuidado ya que modifica la lista original y puede que no sea lo que se desea. Si fuese así solo habría que clonar el objeto antes de barajar. La llamada a esta función es la más sencilla, ya que solamente es necesario pasar la lista a barajar.

random.shuffle(colors)
colors
['R', 'B', 'G']

Como se ha comentado anteriormente, no se puede pasar una tupla como parámetro. Debido a que esto objetos no son mutables la llamada producirá un error.

Conclusiones

En esta entrada se ha visto las funciones que existen en la librería estándar de Python para obtener elementos aleatorios con y sin repetición. Funciones que son respectivamente sample y choises. Además, también se ha visto la función shuffle con la que se puede barajar una lista. Por lo que no es necesario utilizar librerías de terceros para estas tareas.

Imagen de hsiaopuchen en Pixabay

¿Te ha parecido de utilidad el contenido?

Daniel Rodríguez

Share
Published by
Daniel Rodríguez

Recent Posts

Curiosidad: La Paradoja de Simpson, o por qué no siempre debes fiarte de los promedios

En ciencia de datos y estadística, los promedios y porcentajes son herramientas fundamentales para resumir…

21 horas ago

Copias de seguridad automáticas en SQL Server con rotación de archivos

Las bases de datos son el corazón de casi cualquier sistema de información moderno. Ya…

3 días ago

Curiosidad: La Ley de Twyman y la trampa de los datos “interesantes”

En ciencia de datos, pocas cosas llaman más la atención de los científicos de datos…

1 semana ago

Cómo calcular el tamaño de la muestra para encuestas

Calcular adecuadamente el tamaño de la muestra es una parte esencial en el diseño de…

1 semana ago

Curiosidad: El origen del análisis exploratorio de datos y el papel de John Tukey

Hoy en día, cuando pensamos en ciencia de datos, lo primero que nos viene a…

2 semanas ago

Cómo extender el tamaño de un disco en Rocky Linux 9 usando growpart y LVM

Ampliar el espacio de almacenamiento en un sistema Linux es una tarea habitual y crítica…

2 semanas ago

This website uses cookies.