Matlab

Importar matrices en Matlab desde el portapapeles

Matlab dispone de diferentes funciones para trabajar con archivos CSV o Microsoft Excel. Lo que facilita en gran medida la posibilidad de importar datos desde programas que pueden trabajan con estos formatos. Aún así es uso de archivos puede ser un algo incómodo si se compara con la utilización del portapapeles. Desafortunadamente la función que existe en Matlab para importar datos del portapapeles únicamente trabaja con cadenas de texto, por lo que no es posible utilizar para importar directamente matrices desde programas como hojas de cálculo. En esta entrada se va a explicar cómo importar matrices en Matlab desde el portapapeles procedentes de hojas de cálculo como Microsoft Excel.

Actualización: Importar matrices en Windows desde el portapapeles

Gracias al comentario de Adelmo Fernández he comprobado que la función de Matlab importdata() resuelve perfectamente el problema de copiar matrices desde Excel en Windows. Aunque no es así para los usuarios de macOS, por lo menos en la versión 2020b o anteriores.

En Windows, solamente hay copiar la matriz al portapapeles desde Excel y llamar a la función importdata('-pastespecial'). La cual devolverá una matriz con los datos del portapapeles.

El portapapeles en Matlab

Actualmente en Matlab existe una única función para trabajar con el portapapeles: clipboard(). En el caso de que se desee importar el contenido del portapapeles en una sesión se tiene que escribir:

clipboard('paste')

Obteniendo una cadena de texto con el contenido. Esto no es un problema si se quiere importar un único número o una cadena de texto, pero sí lo es para importar datos desde una hoja de cálculo. Por ejemplo, si se copia los datos de la siguiente hoja de un archivo Excel.

Hoja de cálculo Microsoft Excel con los datos que se desean importar

Se obtiene el siguiente resultado

ans =
 
 '1  7       7
  6  5       8
  5  0       2
  6  10     4
  4  0       3'

Con lo que no es posible trabajar directamente.

Procesar el resultado de la función clipboard()

En caso de que se desee utilizar esta matriz en Matlab es necesario procesar la cadena de texto obtenida.

Separar cada una de las filas

La primera tarea es separar cada una de las filas de la cadena de texto, para lo que se puede utilizar la función strsplit(). Entre cada una de las líneas se encuentran dos caracteres: retorno de línea y nueva línea. Siendo posible ultimar cualquiera de los dos para separar. Una posible solución es eliminar el salto de línea, para lo que se usa la función strrep(), y posteriormente dividir con las nuevas líneas. Esto se puede hacer mediante el siguiente código:

data = strrep(data, char(13), '');
data = strsplit(data, '\n');

En donde data contiene inicialmente los datos importados del portapapeles. Pero al final contiene una celda con tantos elementos como filas contenga la matriz.

Separar cada una de las columnas

Una vez separadas las filas es necesario separar las columnas. En esta ocasión el carácter que separa cada uno de los registros es el tabulador. Aquí hay que tener en cuenta que se tiene que se tiene que repetir el código sobre cada una de las filas, por lo que es necesario aplicar la función strsplit() con cellfun(). Por ejemplo, se puede hacer:

data = cellfun(@(s) strsplit(s, '\t'), data', 'UniformOutput', false);

Ahora data es una celda de celdas. Nótese que es necesario transponer data ya que originalmente la salida de strsplit() es un vector fila y es necesario convertirlo en uno de tipo columna.

Convertir los caracteres en números

En este momento en data hay una celda de cadenas de texto. Por lo que es necesario convertir estos en una matriz de números. La función nativa de Matlab para esto es str2double(). Simplemente, teniendo en cuenta que los datos esta en una celda se puede hacer

data = cellfun(@str2double, data, 'UniformOutput', false);
data = cell2mat(data);

Obteniéndose una matriz con los datos del portapapeles.

Código para importar matrices en Matlab desde el portapapeles

Como se ha visto es necesario realizar varios pasos para obtener los datos en el formato deseado. Siendo una buena idea crear una función que permita automatizar los pasos.

function data = pasteFromSpreadsheet()
% pasteFromSpreadsheet - Paste a matrix from a spreadsheet
%
%     This function pastes the data from the clipboard into a matrix,
%     assuming that it comes from a spreadsheet. 

% Copyright 2019 Daniel Rodriguez 

% Get the data from the clipboard
data = clipboard('paste');

% Remove carriage return
data = strrep(data, char(13), '');

% Split the string in rows with new line
data = strsplit(data, '\n');

% Remove empty values at the end of the data
if cellfun(@isempty, data(end))
    data(end) = [];
end

% Separate the values in the column values with the tab
data = cellfun(@(s) strsplit(s, '\t'), data', 'UniformOutput', false);

% Convert the cells to matrix
data = cellfun(@str2double, data, 'UniformOutput', false);
data = cell2mat(data);

end

Problemas con los formatos numéricos

En este punto del ejercicio se puede ver que tenemos un problema. En Español el separador de decimales es la coma, mientras que str2double() solamente funciona con punto. Esto requiere o bien cambiar la cultura del ordenador o bien tenerla en cuenta. En una próxima entrada se explicará cómo crear una función que tenga en cuenta la cultura a la hora de convertir las cadenas de texto en números.

Conclusiones

Lo que se ha visto en esta entrada es cómo importar matrices en Matlab desde el portapapeles procedentes de hojas de cálculo. La tarea no es trivial porque la función para trabajar con el portapapeles en Matlab solamente importa texto. Por lo que es necesario realizar su procesado como se visto.

También se ha visto que, debido a que la función str2double() no tiene en cuenta la cultura, la función que se ha escrito no funciona cuando el separador de decimales no es el punto. Problema que se solucionará en una futura entrada donde se explicará cómo identificar la cultura en Matlab.

Imágenes: Pixabay (Mohamed Hassan)

¿Te ha parecido de utilidad el contenido?

Daniel Rodríguez

Share
Published by
Daniel Rodríguez
Tags: Excel

Recent Posts

De la Regresión Logística al Scorecard: La Transformación Matemática

En un entrada previa explicamos qué son el WOE y el IV y por qué…

1 día ago

Analytics Lane lanza la versión 1.1 del laboratorio con nuevas suites de CLV y Scoring

Seguimos evolucionando el laboratorio de Analytics Lane y hoy lanzamos la versión 1.1, disponible en:…

2 días ago

Interés compuesto: la fuerza que multiplica tu dinero (y los errores que la anulan)

“El interés compuesto es la octava maravilla del mundo. El que lo entiende lo gana…

6 días ago

Cómo comparar datos con barras en Matplotlib: agrupadas, apiladas y porcentuales

Tienes los datos de ventas de tres productos en dos años distintos y quieres saber…

1 semana ago

Costes hundidos en ciencia de datos: cuándo mantener un modelo y cuándo migrar

Imagina la situación. Tu equipo lleva tres años con un modelo en producción. No es…

2 semanas ago

WOE e IV: La Base Matemática del Credit Scoring

Cuando un banco evalúa una solicitud de crédito necesita responder a una pregunta aparentemente simple:…

2 semanas ago

This website uses cookies.