La importación y exportación de datos desde archivos son tareas que se realizan con bastante asiduidad. Por ello, en Python, librerías como pandas incorporan herramientas para el manejo de archivos CSV o en formato Microsoft Excel. Pero, si los datos no se encuentran en un formato estándar, estas herramientas pueden no ser las adecuadas. Por lo tanto, puede ser necesario … [Leer más...] acerca de Cómo leer y escribir archivos en Python
Microsoft se une al proyecto MLflow
Se acaba de anunciar que Microsoft se unirá al proyecto MLflow para la gestión de experimentos de aprendizaje automático. Por lo que pronto se agregará una versión totalmente administrada de MLflow a Azure Machine Learning.MLflow es una plataforma de código abierto diseñada para administrar el ciclo de vida de los modelos de aprendizaje automático de extremo a extremo. La … [Leer más...] acerca de Microsoft se une al proyecto MLflow
¿Qué es el sesgo en aprendizaje automático?
En los procesos de toma de decisiones el término sesgo tiene generalmente connotaciones negativas. No es deseable que un proceso automático lo tenga de ningún tipo. La palabra sesgo procede de sesgar, un verbo que hace referencia a torcer o atravesar algo hacia uno de sus lados. Por lo que una decisión sesgada, que se tuerce en algún sentido, no es deseable. Los modelos de … [Leer más...] acerca de ¿Qué es el sesgo en aprendizaje automático?
5 libros para Data Science
Hoy, día del libro, es una excelente oportunidad para recopilar libros imprescindibles para Data Science. Estos son libros que todo científico de datos, tanto sea usuario de Python como R, deberían conocer y leer.Python Data Science Handbook de Jake VanderPlasPython es actualmente el lenguaje de referencia para los científicos de datos. Algo que se puede apreciar en … [Leer más...] acerca de 5 libros para Data Science
Ejecutar SQL Server en una máquina virtual VirtualBox
Los sistemas de virtualización facilitan la ejecución otros sistemas operativos sin la necesidad de reiniciar el ordenador. Con lo que se puede ejecutar aplicaciones que no se encuentran disponibles en un sistema operativo o probar diferentes configuraciones sin riesgo de afectar a una máquina. Además de esto también se pueden instalar servidores para usar sus servicios desde … [Leer más...] acerca de Ejecutar SQL Server en una máquina virtual VirtualBox
Semana sin publicaciones
Hoy es lunes, por lo que correspondería una entrada regular, pero esta semana no habrá nuevas publicaciones en el blog. Esta semana se hacemos un parón en el ritmo de publicaciones. Pero las entradas regresarán el lunes 22 de abril con nuevas entradas.Si queréis ayudar al mantenimiento de Analytics Lane podéis hacerlo comprando en las tiendas asociadas a través de nuestros … [Leer más...] acerca de Semana sin publicaciones
Seis comandos mágicos de Jupyter Notebooks
Los Jupyter Notebooks son una herramienta web con la que se puede ejecutar código de forma interactiva, almacenar los resultados y documentar el proceso. Actualmente es muy popular para explicar las técnicas y los procedimientos empleados en tareas de análisis de datos. Una de las características más poderosas de Jupyter Notebooks son los comandos mágicos. Los que son accesos … [Leer más...] acerca de Seis comandos mágicos de Jupyter Notebooks
linespace y el operador dos puntos en Matlab
En Matlab posiblemente el operador más utilizado es dos puntos. Con él es posible crear vectores espaciados que se pueden utilizar para seleccionar subíndices en arrays e iterar sobre los bucles for. Pero en muchas ocasiones puede carecer de suficiente flexibilidad. Para ello existen funciones como linspace y logspace con las que es posible disponer de mayor control para … [Leer más...] acerca de linespace y el operador dos puntos en Matlab
Disponible Anaconda 2019.03
Anaconda acaba de anunciar la disponibilidad de la versión 2019.03 de su distribución de Python y R ampliamente utilizada en ciencia de datos y aprendizaje automático. La cual utiliza en el sistema de administración de paquetes conda 4.6.11. en esta versión se han actualizado más de 100 paquetes entre los que destacan SciPy, NumPy, Pandas, MKL, Numba, Dask, PyTables, OpenSSL y … [Leer más...] acerca de Disponible Anaconda 2019.03
Significado de las medidas de la cobertura de pruebas unitarias
En una entrada reciente se ha explicado cómo medir la cobertura de las pruebas unitarias en un proyecto JavaScript. Para lo que se utilizaron los informes creados con Istanbul. Los informes contenían cuatro valores que generalmente son diferentes: líneas, funciones, sentencias y ramas. Así es normal preguntarse qué mide concretamente cada uno de estos valores, ya medidas … [Leer más...] acerca de Significado de las medidas de la cobertura de pruebas unitarias
5 extensiones para Jupyter Notebook con los que mejorar la productividad
Jupyter Notebook es una excelente herramienta en la que es posible integrar código interactivo con ecuaciones, gráficas y documentación. Por lo que es una solución ampliamente utilizada en entornos educativos, para tareas de exploración de datos y la documentación de algoritmos. Aún así es posible que falten algunas funcionalidades con las que mejorar nuestra productividad a la … [Leer más...] acerca de 5 extensiones para Jupyter Notebook con los que mejorar la productividad
5 características avanzadas de VirtualBox
VirtualBox es uno de los programas de virtualización más populares para la arquitectura x86/amd64. Permitiendo ejecutar diferentes sistemas operativos en máquinas con otros instalados, sin la necesidad de reiniciar. Por ejemplo, Windows en máquinas Linux o Mac. En esta ocasión se van a mostrar 5 características avanzadas de VirtualBox que exprimir esta herramienta.Modo … [Leer más...] acerca de 5 características avanzadas de VirtualBox