Las bases de datos generalmente suelen ocupar mucho espacio en el disco. Aunque no siempre todo contiene datos. Al eliminar registros en una base de datos, generalmente el tamaño de los archivos no se reduce porque estos se marcan como eliminados pero el espacio no se elimina del disco. A medida que pase el tiempo, esto puede suponer una cantidad importante de espacio en el … [Leer más...] acerca de Reducir el tamaño en SQL Server de una base de datos
Evaluación del uso de Tabnine (herramienta de autocompletado de código) en la creación de modelos de aprendizaje automático
El autocompletado de código es una funcionalidad que se encuentra en la mayoría de los editores de código modernos. Lo que evita muchos errores y consultas a la documentación. Recientemente han aparecido en el mercado unas soluciones basadas en inteligencia artificial que prometen un paso más allá; no solo completan el código, sino que puede escribir éste de forma automática en … [Leer más...] acerca de Evaluación del uso de Tabnine (herramienta de autocompletado de código) en la creación de modelos de aprendizaje automático
Diferencias entre loc e iloc en Pandas
La selección de elementos en los DataFrames de Pandas se puede realizar mediante dos métodos: loc e iloc. Aunque, en algunos casos, pueden parecer intercambiables, no es así. Existen importantes diferencias entre loc e iloc. Conocer estas permite seleccionar la opción más adecuada en cada caso.Principal diferencia entre loc e ilocLa principal diferencia que existe entre … [Leer más...] acerca de Diferencias entre loc e iloc en Pandas
AirTag: los dispositivos de localización Bluetooth de Apple
Los dispositivos de localización Bluetooth no son un concepto nuevo, ya existían dispositivos comerciales desde hace una década. De hecho, ya hablé de este tipo de gadgets en el blog hace tres años. Pequeños dispositivos, algo más grandes que una moneda, que se pueden llevar junto a objetos como llaves o mochilas para facilitar su localización en caso de extravío. A través de … [Leer más...] acerca de AirTag: los dispositivos de localización Bluetooth de Apple
Creación de archivos Zip en Node
Los archivos Zip son posiblemente el formato de compresión de datos sin pérdida más utilizado. Convirtiéndolo en un estándar para comprimir cualquier tipo de documento, pudiendo de esta forma tanto almacenar como enviar este en un archivo mucho más pequeño que el original. Lo que permite ahorrar espacio de almacenamiento o ancho de banda. Veamos cómo se pueden crear los … [Leer más...] acerca de Creación de archivos Zip en Node
Almacenar variables en Jupyter
Durante una sesión de trabajo en un Notebook de Jupyter los diferentes resultados que se obtengan se pueden almacenar las variables y recuperarlos posteriormente. Aunque, una vez se cierre el Notebook o se reinicie el núcleo (kernel) de IPython, los valores se pierden ya que solamente están almacenados en memoria. Cuando se necesita persistencia de datos se pueden almacenar … [Leer más...] acerca de Almacenar variables en Jupyter
7 extensiones de Visual Studio Code para ciencia de datos
Visual Studio Code es un entorno de desarrollo integrado (IDE) muy popular entre los desarrolladores. Multiplataforma, existen versiones para Windows, macOS y Linux, y gratuito. Su gran popularidad se debe a que ofrece herramientas para trabajar practicante con cualquier lenguaje y frameworks, además de ofrecer la posibilidad de extender sus funcionalidades mediante extensiones … [Leer más...] acerca de 7 extensiones de Visual Studio Code para ciencia de datos
Medir la velocidad de escritura del disco en Linux
En muchas ocasiones el cuello de botella de nuestro equipo es el disco duro. La velocidad de lectura puede hacer que el procesador tenga que esperar para procesar los datos, mientras que la velocidad de escritura puede hacer que se demore la terminación del procesos. Por eso es importante conocer la velocidad de nuestro disco. En el caso de los sistemas UNIX una de las formas … [Leer más...] acerca de Medir la velocidad de escritura del disco en Linux
Recuperar el resultado de una celda en Jupyter
Al trabajar en un Notebook de Jupiter es posible que después de ejecutar un comando que requiere bastante tiempo nos demos cuenta de que no se ha asignado el resultado a una variable. Podríamos pensar que la única solución sería modificar el código y volver a ejecutarlo. Pero existe una solución mejor, se puede recuperar los resultados de cualquier celda en Jupyter con un … [Leer más...] acerca de Recuperar el resultado de una celda en Jupyter
Mini PC para Machine Learning en 2023
La semana pasada se publicó una revisión de ordenadores portátiles que pueden ser una opción para realizar tareas de Machine Learning. Aunque, cuando no es necesaria la portabilidad que ofrecen estos equipos, existe una opción ligeramente más económica: los Mini PC. Ordenadores de sobremesa que tiene un tamaño reducido. Veamos las opciones que nos pueden ofrecer los mini PC … [Leer más...] acerca de Mini PC para Machine Learning en 2023
Ejecutar una función con retraso en Matlab
Generalmente al escribir un comando en Matlab queremos que este se ejecute al momento, y es lo que sucede. Pero, en algunas ocasiones puede ser interesante que la función no se ejecute al momento, sino que un tiempo después. Por ejemplo, para actualizar una figura con nuevos datos. Aunque el lenguaje no cuenta con una función para realizar esta trate específicamente, es posible … [Leer más...] acerca de Ejecutar una función con retraso en Matlab
Configurar el API de Scikit-learn para generar DataFrames
La nueva versión 1.3 de Scikit-learn trae importantes novedades. Una de ellas es la posibilidad de configurar el API de las herramientas de transformación de datos o transformers. Hasta ahora en Scikit-learn al utilizar un transformer el resultado que se obtiene es un ndarray de NumPy. A partir de la versión 1.3, es posible configurar el tipo de objeto resultante mediante el … [Leer más...] acerca de Configurar el API de Scikit-learn para generar DataFrames











