Matlab

Matrices dispersas en Matlab

En una entrada reciente se ha escrito acerca de las matrices dispersas (“sparse matrix”) en las que la mayoría de los elementos son cero. Guardar estas matrices en memoria como si fuesen matrices densas, donde la mayoría de los elementos son distintos de cero, no es eficiente. Para ello Matlab dispone de diferentes funciones que permiten convertir matrices densas en dispersas y el paso contrario. Si trabajamos con matrices dispersas en Matlab es necesario conocer cómo funcionan las funciones sparse() y full() que se explicarán a continuación.

Convertir una matriz en dispersas

En el caso de que se tenga una matriz dispersa en Matlab se puede almacenar esta de una forma más eficiente utilizando la función sparse(). Al llamar a esta función con una matriz se obtendrá un objeto en el que solamente se guardan los valores diferentes de cero. Por ejemplo, se pueden comparar la representación de una matriz diagonal almacenada en un formato u otro.

M = eye(3)
S = sparse(M)
M =

     1     0     0
     0     1     0
     0     0     1


S =

   (1,1)        1
   (2,2)        1
   (3,3)        1

Como se puede ver en ejemplo en el segundo caso solamente se almacenan los valores diferentes de cero. Si se desea recuperar la matriz original se puede utilizar la función full().

full(S)
ans =

     1     0     0
     0     1     0
     0     0     1

Trabajar con matrices dispersas en Matlab

A la hora de trabajar con matrices dispersas no existe ninguna diferencia respeto a usarlas normales. Siendo válido el mismo código en ambos casos, ya que Matlab las trata exactamente igual. Por ejemplo, se puede ver cómo multiplicar una matriz normal por una dispersa es igual que hacer con una normal

M = randi(20, 2, 2);
I = [0, 1; 0, 0];
S = sparse(I);

M * S
M * I
ans =

     0    17
     0    14


ans =

     0    17
     0    14

Como se puede ver en el ejemplo en ambos casos se ha utilizado el mismo código y obtenido el mismo resultado.

Ahorro de memoria en las matrices dispersas

Utilizando la función whos se puede el espacio que ocupa cada una de las variables. Así es posible conocer el ahorro que suponer guardar la matriz en un formato u otro.

  Name      Size            Bytes  Class     Attributes

  M         3x3                72  double              
  S         3x3                80  double    sparse 

En el ejemplo se puede ver que la matriz original ocupa 72 bytes, mientras que guarda como dispersa 80. En este caso no se obtiene ahorro, de hecho, la matriz guardada como dispersa ocupa más, porque la matriz solamente es de 3×3. En caso de que se aumente el tamaño de la matriz la matriz dispersa comenzará a ocupar menos memoria. Por ejemplo, en una matriz de 100×100 la original ocupará 80000 bytes, mientras que al guardarlo como dispersa solamente 2408, solamente un 3% de la original.

  Name        Size             Bytes  Class     Attributes

  M         100x100            80000  double              
  S         100x100             2408  double    sparse

Una forma más clara de ver esto es representar en una gráfica el tamaño relativo de la matriz en formato disperso respecto a la normal. Esto es lo que se muestra en la siguiente figura. En donde se puede apreciar que, para una matriz con el grado de dispersión utilizado, el ahorro es considerable de una dimensión 50. Si el grado de dispersión es mayor el ahorro se obtendrá antes.

Comparación de la memoria necesaria para almacenar una matriz diagonal en formato disperso frente a denso en función de las dimensiones.

Conclusiones

En esta entrada se ha visto cómo trabajar con matrices dispersas en Matlab, observado que su uso es completamente transparente. Además, se ha comparado el tamaño que ocupan ambos objetos en memoria y como son más eficaces las dispersas a medida que aumentan las dimensiones.

Imágenes: Pixabay (Free-Photos)

¿Te ha parecido de utilidad el contenido?

Daniel Rodríguez

Share
Published by
Daniel Rodríguez

Recent Posts

Curiosidad: La Paradoja de Simpson, o por qué no siempre debes fiarte de los promedios

En ciencia de datos y estadística, los promedios y porcentajes son herramientas fundamentales para resumir…

20 horas ago

Copias de seguridad automáticas en SQL Server con rotación de archivos

Las bases de datos son el corazón de casi cualquier sistema de información moderno. Ya…

3 días ago

Curiosidad: La Ley de Twyman y la trampa de los datos “interesantes”

En ciencia de datos, pocas cosas llaman más la atención de los científicos de datos…

1 semana ago

Cómo calcular el tamaño de la muestra para encuestas

Calcular adecuadamente el tamaño de la muestra es una parte esencial en el diseño de…

1 semana ago

Curiosidad: El origen del análisis exploratorio de datos y el papel de John Tukey

Hoy en día, cuando pensamos en ciencia de datos, lo primero que nos viene a…

2 semanas ago

Cómo extender el tamaño de un disco en Rocky Linux 9 usando growpart y LVM

Ampliar el espacio de almacenamiento en un sistema Linux es una tarea habitual y crítica…

2 semanas ago

This website uses cookies.