Actualmente, los documentos PDF son una parte fundamental para el intercambio de información. Siendo un formato omnipresente. Es normal encontrarse con ellos en una amplia gama de contextos como los informes empresariales, los documentos académicos y la publicación de normativa. Por ello es habitual encontrarse con la necesidad de extraer la información relevante de miles de … [Leer más...] acerca de Resumir PDF con Python y OpenAI
Eliminación de duplicados en DataFrames de Pandas
Los DataFrames de Pandas es uno de los principales objetos para el análisis de datos en Python. Al trabajar con datos reales, uno de los problemas más comunes es la presencia de valores duplicados, lo que puede afectar tanto a la integridad como a la precisión de los análisis. Afortunadamente, en los DataFrames de Pandas existen herramientas para la eliminación de duplicados de … [Leer más...] acerca de Eliminación de duplicados en DataFrames de Pandas
Selección del valor óptimo de K en SelecKBest de scikit-learn
Para poder entrenar un modelo de aprendizaje automático de forma correcta es necesario seleccionar las características. Un proceso clave para mejorar el rendimiento de los modelos. En Python, uno de los posibles métodos para ello es SelectKBest (o su equivalente SelectPercentile). Una de las herramientas de selección de características que se encuentran disponibles en … [Leer más...] acerca de Selección del valor óptimo de K en SelecKBest de scikit-learn
Extensiones de Visual Studio Code para científicos de datos
Visual Studio Code (VS Code) es uno de los editores de código fuente más populares en la actualidad. Una de sus características clave es la posibilidad de instalar extensiones con las que agregar nuevas funciones y mejorar los flujos de trabajo de cada usuario. Los científicos de datos no son una excepción. En esta entrada se revisarán una serie de extensiones de Visual Studio … [Leer más...] acerca de Extensiones de Visual Studio Code para científicos de datos
Comprender los parámetros *args y **kwargs de las funciones Python
Al revisar funciones de Python es habitual encontrar que estas tienen los parámetros *args y **kwargs. Unos parámetros especiales que permiten a las funciones manejar un número variables de argumentos de una forma flexible. Aunque puede parecer algo confuso al principio, cuando se comprende cómo funcionan estos parámetros es posible crear fácilmente funciones versátiles y … [Leer más...] acerca de Comprender los parámetros *args y **kwargs de las funciones Python
Auriculares USB con micrófono y cancelación de ruido para videoconferencias
El trabajo remoto ha convertido las videoconferencias en una parte importante de la actividad diaria. Por lo que es necesario contar con unos auriculares adecuados. El uso de un equipo que nos pueda aislar de los ruidos del entorno y recoger nuestra voz de forma correcta puede marcar la diferencia entre una reunión productiva y una experiencia frustrante. En esta ocasión, … [Leer más...] acerca de Auriculares USB con micrófono y cancelación de ruido para videoconferencias
Solución a los problemas de ejecución de scripts en Windows 11 cuando se da el mensaje: “No se puede cargar el archivo porque la ejecución de scripts está deshabilitada en este sistema”
Windows 11 ha introducido cambios en la política de ejecución de scripts y comandos que puede afectar al funcionamiento de varias herramientas. Para la mayoría de los usuarios esto supone una mejora en la seguridad del sistema. Pero no así para los desarrollados, que pueden ver como ciertas herramientas no funcionan después de cambiar de sistema operativo. O actualizar este a … [Leer más...] acerca de Solución a los problemas de ejecución de scripts en Windows 11 cuando se da el mensaje: “No se puede cargar el archivo porque la ejecución de scripts está deshabilitada en este sistema”
Cómo convertir una lista de diccionarios en un DataFrame de Pandas en Python
Al trabajar con datos en Python, es común encontrarse con la necesidad de convertir diferentes estructuras de datos en otros que sean más fáciles de manipular y analizar. Uno de estos problemas más comunes es el de convertir una lista de diccionarios en un DataFrame de Pandas. En esta entrada, se explicará cómo transformar una lista de diccionarios en un DataFrame de Pandas en … [Leer más...] acerca de Cómo convertir una lista de diccionarios en un DataFrame de Pandas en Python
Seleccionar el tipo de aprendizaje para un problema de Machine Learning
En Aprendizaje Automático o Machine Learning seleccionar el tipo de aprendizaje a usar en cada proyecto es una tarea clave para garantizar el éxito de este. Escogiendo el que sea más adecuado entre aprendizaje supervisado, no supervisado o por refuerzo. Dado que cada uno tiene características propias, haciéndolo adecuados o no para diferentes aplicaciones, seleccionar un modelo … [Leer más...] acerca de Seleccionar el tipo de aprendizaje para un problema de Machine Learning
Copias de seguridad en PostgreSQL con pg_dump
Disponer de copias de seguridad de las bases de datos es un aspecto crítico para garantizar la integridad y disponibilidad de la información. PostgreSQL no es una excepción. Por ello, entre las herramientas que incluye este sistema de gestión de bases de datos de código abierto se incluyen varias herramientas para realizar copias de seguridad como pg_dump. En esta entrada se … [Leer más...] acerca de Copias de seguridad en PostgreSQL con pg_dump
Creación de Ridge Plots en Python con Seaborn: Guía completa paso a paso
Una de las mejores opciones para poder visualizar la forma de la distribución de un conjunto de datos son los gráficos de densidad (KDE, Kernel Density Estimation). Especialmente cuando se desconoce la distribución subyacente. Si, además, para un conjunto de datos, se desea analizar cómo evoluciona la distribución a lo largo de una dimensión categórica, como puede ser el tiempo … [Leer más...] acerca de Creación de Ridge Plots en Python con Seaborn: Guía completa paso a paso
Entendiendo la diferencia entre votación hard y votación soft en aprendizaje automático
La precisión y la robustez de los modelos es una de las características por la que los modelos de Aprendizaje Automático son tan útiles en una variedad de problemas. Una de las técnicas para mejorar estas características en los modelos es el Aprendizaje por Conjuntos (Ensemble Learning). En este tipo de aprendizaje se entrenan diferentes modelos y las predicciones se obtienen … [Leer más...] acerca de Entendiendo la diferencia entre votación hard y votación soft en aprendizaje automático










