Para aquellos que trabajamos al mismo tiempo con Matlab y Python es posible que nos encontremos con la necesidad tanto de leer cómo guardar archivos de Matlab en Python. Archivos binarios los cuales suelen tener la extensión mat. Esto es algo que se puede hacer fácilmente con SciPy.Crear un archivo matEn primer lugar, necesitamos crear un archivo mat. Algo que se puede … [Leer más...] acerca de Leer y guardar archivos de Matlab en Python
Python
Python es un lenguaje de programación interpretado con una filosofía basada en la legibilidad del código. Un lenguaje que gracias posee un gran ecosistema de librerías para la ciencia de datos. Por lo que es uno de los más populares en la actualidad entre los científicos de datos. Además, es uno de los lenguajes más deseados y adorados por los programadores según las encuestas de Stack Overflow.
Python es un lenguaje de programación interpretado de propósito general que obliga al uso de una sintaxis clara, gracias a la cual el código es altamente legible. Siendo un lenguaje potente y fácil de aprender. Además, permite utilizar múltiples paradigmas de programación. Lo que permite usar desde programación orientada a objetos, pasando por programación imperativa o funcional.
Los paquetes de Python más utilizados por los científicos son:
- NumPy: permite el tratamiento de datos basados en matrices,
- Pandas: ideal para la manipulación de datos heterogéneos mediante objetos DataFrame,
- SciPy: implementa tareas habituales en computación científica,
- Matplotlib: facilita la visualización de datos y scikit-learn creación de modelos de aprendizaje automático.
Las publicaciones de esta sección versan sobre estas librerías y las bases del lenguaje.
Ignorar acentos al comparar cadenas de texto y diferencias entre mayúsculas o minúsculas
En Python es relativamente fácil comparar si dos cadenas de caracteres son iguales, solamente se tiene que utilizar el operador comparación (==). Pero esta forma de comparar diferencia entre mayúsculas y minúsculas, cosa que en muchos casos no es lo que se quiere. También nos podemos encontrar con el problema de espacios en blanco introducidos accidentalmente. Además de estos, … [Leer más...] acerca de Ignorar acentos al comparar cadenas de texto y diferencias entre mayúsculas o minúsculas
Truco Python: identificar filas o columnas únicas en numpy
Numpy ofrece la función np.unique() para identificar los elementos únicos dentro de un array. Una función que es muy útil. Pero lo que mucha gente no sabe es que se puede utilizar no solo para identificar los elementos únicos dentro de un array, sino que también para identificar filas o columnas únicas en los objetos bidimensionales.Para identificar las filas o columnas … [Leer más...] acerca de Truco Python: identificar filas o columnas únicas en numpy
Novedades en pandas 1.0
El pasado día 29 de enero de 2020 se lanzó oficialmente la versión 1.0.0 de Pandas, lo que indica el grado de madurez que ha alcanzado esta librería. En esta entrada vamos a ver algunas de las novedades que trae Pandas 1.0.Pandas es librería para la limpieza, exploración y manipulación de datos más popular en Python. Al extender las funcionalidades de los vectores de NumPy … [Leer más...] acerca de Novedades en pandas 1.0
Truco Python: identificar diptongos o triptongos en una cadena de texto en Python
Recientemente me han planteado cómo identificar triptongos en cadena de texto dentro de los elementos de una lista en Python. Siendo esta una tarea que se puede realizar fácilmente recurriendo a las expresiones regulares. Una herramienta tan poderosa y muchas veces olvidadas.Buscar un grupo de caracteres en una cadena de textoPara buscar un grupo de caracteres en una … [Leer más...] acerca de Truco Python: identificar diptongos o triptongos en una cadena de texto en Python
Métodos y variables subrayadas en Python
En Python es habitual encontrar nombres de variables o métodos que comienzan o finalizan con uno o dos caracteres subrayado. Indicando que estos elementos son especiales. En esta entrada se va a explicar cual es el significado de los métodos y las variables subrayadas en Python.Nombres que comienzan con un carácter de subrayado (_name)Las variables y métodos cuyo nombre … [Leer más...] acerca de Métodos y variables subrayadas en Python
Filter, map y reduce en un diccionario de Python
En una entrada anterior realicé una introducción a la programación funcional en Python. Una entrada donde se explicaba cómo utilizar filter(), map() y reduce() sobre listas o tuplas. Pero no sobre diccionarios. En esta entrada se va a explicar cómo hacer utilizar filter, map o reduce en un diccionario de Python.Diccionarios frente listas o tuplas en programación … [Leer más...] acerca de Filter, map y reduce en un diccionario de Python
Filtrado de cadenas de texto en DataFrame con Pandas
En una entrada anterior se explicó cómo filtrar registros en DataFrames de Pandas en base a los valores de los registros. Para lo que se utilizaron ejemplos únicamente numéricos. En los comentarios de la entrada varios lectores preguntasteis cómo hacer el filtrado de cadenas de texto en DataFrame, ya que esta es una tarea también habitual.En la entrada de hoy nos vamos a … [Leer más...] acerca de Filtrado de cadenas de texto en DataFrame con Pandas
WinPython
Hace poco hablé en una entrada de HeidiSQL, un administrador de bases de datos para Microsoft Windows que tiene la peculiaridad de disponer de una versión portable. Lo que puede ser útil en muchas ocasiones. Por ejemplo, cuando necesitamos la herramienta en un entorno donde no disponemos de derechos de instalación. O simplemente cuando no queremos instalar un programa solamente … [Leer más...] acerca de WinPython
Numpy básico
El trimestre pasado hemos dedicado las entradas de los miércoles a algunas de las tareas básicas que se pueden hacer con Numpy. Una serie que llamamos Numpy básico. En esta entrada vamos a recopilar los enlaces a todas las entradas para que su consulta pueda ser más sencilla.Las entradas publicadas en la serie “Numpy básico” son:Creación de un Array de Numpy a partir de … [Leer más...] acerca de Numpy básico
Truco Jupyter: ¿cómo se eliminar la salida en una celda de un IPython Notebook?
La salida de las celdas de un IPython Notebook son los resultados su ejecución. Por lo que en la mayoría de los casos es una información tanto útil y como necesaria. Pero a medida que crecen los análisis realizados en algunos IPython Notebook la información mostrada puede ser redundante e innecesaria. Por lo que puede útil poder eliminar la salida en una celda de un IPython … [Leer más...] acerca de Truco Jupyter: ¿cómo se eliminar la salida en una celda de un IPython Notebook?
Numpy básico: como invertir arrays de Numpy
Una de las tareas básicas que más me preguntan es cómo invertir vectores o matrices. En esta entrada vamos a ver diferentes métodos para invertir arrays de Numpy. Para lo que usaremos el operador [] y el método np.flip().Invertir vectores en NumpyComo siempre lo primero que tenemos que hacer para invertir un vector en Numpy es importar la librería y un vector para … [Leer más...] acerca de Numpy básico: como invertir arrays de Numpy