• Saltar al contenido principal
  • Skip to secondary menu
  • Saltar a la barra lateral principal
  • Saltar al pie de página
  • Inicio
  • Secciones
    • Ciencia de datos
    • Criptografía
    • Herramientas
    • Machine Learning
    • Noticias
    • Opinión
    • Productividad
    • Programación
      • JavaScript
      • Julia
      • Matlab
      • Python
      • R
  • Programación
    • JavaScript
    • Julia
    • Matlab
    • Python
    • R
  • Laboratorio
    • Encuestas: Tamaño de Muestra
    • Lotería: Probabilidad de Ganar
    • Reparto de Escaños (D’Hondt)
    • Tres en Raya con IA
  • Noticias
  • Boletín
  • Contacto
  • Tienda
    • Libros
    • Equipamiento de oficina
    • Equipamiento en movilidad
    • Tiendas afiliadas
      • AliExpress
      • Amazon
      • Banggood
      • GeekBuying
      • Lenovo

Analytics Lane

Ciencia e ingeniería de datos aplicada

  • Ciencia de datos
  • Machine Learning
  • IA Generativa
  • Python
  • Pandas
  • NumPy
  • R
  • Excel

Python

Python es un lenguaje de programación interpretado con una filosofía basada en la legibilidad del código. Un lenguaje que gracias posee un gran ecosistema de librerías para la ciencia de datos. Por lo que es uno de los más populares en la actualidad entre los científicos de datos. Además, es uno de los lenguajes más deseados y adorados por los programadores según las encuestas de Stack Overflow.

Python es un lenguaje de programación interpretado de propósito general que obliga al uso de una sintaxis clara, gracias a la cual el código es altamente legible. Siendo un lenguaje potente y fácil de aprender. Además, permite utilizar múltiples paradigmas de programación. Lo que permite usar desde programación orientada a objetos, pasando por programación imperativa o funcional.

Los paquetes de Python más utilizados por los científicos son:

  • NumPy: permite el tratamiento de datos basados en matrices,
  • Pandas: ideal para la manipulación de datos heterogéneos mediante objetos DataFrame,
  • SciPy: implementa tareas habituales en computación científica,
  • Matplotlib: facilita la visualización de datos y scikit-learn creación de modelos de aprendizaje automático.

Las publicaciones de esta sección versan sobre estas librerías y las bases del lenguaje.

Eliminar características colineales con la matriz de correlación

marzo 3, 2023 Por Daniel Rodríguez Deja un comentario
Tiempo de lectura: 3 minutos

En aprendizaje automático el uso de características colineales para el entrenamiento es un problema que puede afectar a la calidad de los modelos, especialmente en los lineales. Por lo que es necesario identificarlas y eliminarlas. Una de las razones para hacer esto es usar la matriz de correlación dado que la multicolinealidad se produce cuando dos o más características están … [Leer más...] acerca de Eliminar características colineales con la matriz de correlación

Generación de números aleatorios criptográficamente seguros en Python

febrero 27, 2023 Por Daniel Rodríguez Deja un comentario
Tiempo de lectura: 2 minutos

La generación de número aleatorios criptográficamente seguros es clave para poder garantizar la seguridad y privacidad de los sistemas. Cuando los valores se obtienen de funciones que no se pueden considerar seguras, como es el caso de las librerías random o NumPy, es posible predecir los números generados. Algo que un atacante puede usar para acceder a los datos que se desean … [Leer más...] acerca de Generación de números aleatorios criptográficamente seguros en Python

Usar ChatGPT en Python

febrero 22, 2023 Por Daniel Rodríguez Deja un comentario
Tiempo de lectura: 2 minutos

La semana pasada analicé cómo puede ayudar a los científicos de datos el uso de ChatGPT, comprobando que este puede implementar rápidamente análisis de datos y modelos básicos. Para lo que utilice la aplicación de chat disponible en la propia web de OpenAI. Otro método para acceder a ChatGPT es empleando el API que ofrece OpenAI, lo que permite integrar fácilmente el modelo en … [Leer más...] acerca de Usar ChatGPT en Python

Optimización de código Python con LineProfiler

febrero 20, 2023 Por Daniel Rodríguez Deja un comentario
Tiempo de lectura: 3 minutos

LineProfiler es una herramienta que puede ser de gran ayuda para la optimización de código Python. Debido a que permite medir el tiempo que necesita para ejecutar cada una de las líneas de un programa. Pudiendo identificar de esta manera aquellas que requieren más tiempos. Así, se pueden focalizar los esfuerzos en mejorar el rendimiento solamente de aquellas partes de código … [Leer más...] acerca de Optimización de código Python con LineProfiler

Interpretación de las predicciones de los árboles de regresión y Random Forest

febrero 17, 2023 Por Daniel Rodríguez Deja un comentario
Tiempo de lectura: 3 minutos

Una de las ventajas de usar árboles de regresión es su interpretabilidad. Cuando se crea un modelo a partir de un árbol de regresión no solamente se puede obtener una predicción para cada uno de los registros, sino que también es posible saber cuánto afecta cada una de las características usadas al resultado final. Aunque esto no se puede hacer directamente en Scikit-learn. … [Leer más...] acerca de Interpretación de las predicciones de los árboles de regresión y Random Forest

Reemplaza loc e iloc para mejorar el rendimiento en bucles

febrero 13, 2023 Por Daniel Rodríguez Deja un comentario
Tiempo de lectura: 4 minutos

Dos de los métodos más utilizados para acceder a los elementos de una Serie o un DataFrame en Pandas son loc e iloc. Algo que se debe a su gran flexibilidad, permite seleccionar elementos o subconjuntos usando tanto los nombres de las etiquetas (loc) como la posición (iloc) de forma intuitiva. Aunque, en algunos casos, pueden ofrecer problemas de rendimiento. Por ejemplo, en … [Leer más...] acerca de Reemplaza loc e iloc para mejorar el rendimiento en bucles

Diferencias entre loc e iloc en Pandas

febrero 6, 2023 Por Daniel Rodríguez Deja un comentario
Tiempo de lectura: 3 minutos

pandas

La selección de elementos en los DataFrames de Pandas se puede realizar mediante dos métodos: loc e iloc. Aunque, en algunos casos, pueden parecer intercambiables, no es así. Existen importantes diferencias entre loc e iloc. Conocer estas permite seleccionar la opción más adecuada en cada caso.Principal diferencia entre loc e ilocLa principal diferencia que existe entre … [Leer más...] acerca de Diferencias entre loc e iloc en Pandas

Almacenar variables en Jupyter

enero 30, 2023 Por Daniel Rodríguez Deja un comentario
Tiempo de lectura: 3 minutos

Durante una sesión de trabajo en un Notebook de Jupyter los diferentes resultados que se obtengan se pueden almacenar las variables y recuperarlos posteriormente. Aunque, una vez se cierre el Notebook o se reinicie el núcleo (kernel) de IPython, los valores se pierden ya que solamente están almacenados en memoria. Cuando se necesita persistencia de datos se pueden almacenar … [Leer más...] acerca de Almacenar variables en Jupyter

Recuperar el resultado de una celda en Jupyter

enero 23, 2023 Por Daniel Rodríguez Deja un comentario
Tiempo de lectura: 3 minutos

Al trabajar en un Notebook de Jupiter es posible que después de ejecutar un comando que requiere bastante tiempo nos demos cuenta de que no se ha asignado el resultado a una variable. Podríamos pensar que la única solución sería modificar el código y volver a ejecutarlo. Pero existe una solución mejor, se puede recuperar los resultados de cualquier celda en Jupyter con un … [Leer más...] acerca de Recuperar el resultado de una celda en Jupyter

Configurar el API de Scikit-learn para generar DataFrames

enero 16, 2023 Por Daniel Rodríguez Deja un comentario
Tiempo de lectura: 2 minutos

La nueva versión 1.3 de Scikit-learn trae importantes novedades. Una de ellas es la posibilidad de configurar el API de las herramientas de transformación de datos o transformers. Hasta ahora en Scikit-learn al utilizar un transformer el resultado que se obtiene es un ndarray de NumPy. A partir de la versión 1.3, es posible configurar el tipo de objeto resultante mediante el … [Leer más...] acerca de Configurar el API de Scikit-learn para generar DataFrames

Uso de Eval en Pandas para analizar datos de forma sencilla

diciembre 12, 2022 Por Daniel Rodríguez Deja un comentario
Tiempo de lectura: 2 minutos

El método eval() de los DataFrames de Pandas permite indicar mediante una cadena de texto las operaciones que se desean realizar sobre las columnas del conjunto de datos. Con un funcionamiento similar al de método query(). Pudiendo combinar ambos para llevar a cabo operaciones complejas sobre los datos de los DataFrames de una forma relativamente sencilla. Veamos algunos de los … [Leer más...] acerca de Uso de Eval en Pandas para analizar datos de forma sencilla

Barajar las filas de un DataFrame con Pandas

diciembre 5, 2022 Por Daniel Rodríguez Deja un comentario
Tiempo de lectura: 3 minutos

pandas

Los DataFrames de Pandas disponen del método sample() con el que se puede obtener una muestra aleatoria de los registros de un conjunto de datos. Método que se puede emplear para barajar las filas de un DataFrame. Veamos algunos de los usos que se le puede dar al método sample().Conjunto de ejemploAntes de continuar es necesario disponer de un conjunto de datos de … [Leer más...] acerca de Barajar las filas de un DataFrame con Pandas

  • « Ir a la página anterior
  • Página 1
  • Páginas intermedias omitidas …
  • Página 9
  • Página 10
  • Página 11
  • Página 12
  • Página 13
  • Páginas intermedias omitidas …
  • Página 34
  • Ir a la página siguiente »

Barra lateral principal

Suscríbete a nuestro boletín

Suscríbete al boletín semanal para estar al día de todas las publicaciones.

Política de Privacidad

Analytics Lane en redes sociales

  • Amazon
  • Bluesky
  • Facebook
  • GitHub
  • Instagram
  • Mastodon
  • Pinterest
  • RSS
  • Telegram
  • Tumblr
  • Twitter
  • YouTube

Publicidad

Entradas recientes

Cómo crear un Data Lake en Azure paso a paso

noviembre 13, 2025 Por Daniel Rodríguez

¿Por qué el azar no es tan aleatorio como parece?

noviembre 11, 2025 Por Daniel Rodríguez

Noticias

Detectan vulnerabilidad crítica en MLflow que permite ejecución remota de código

noviembre 10, 2025 Por Daniel Rodríguez

Publicidad

Es tendencia

  • Hoja de cálculo para repartir los escaños en base al método D’Hont Aplicar el método D’Hondt en Excel publicado el abril 14, 2021 | en Herramientas
  • Operaciones de filtrado de DataFrame con Pandas en base a los valores de las columnas publicado el mayo 10, 2019 | en Python
  • Creación de gráficos de barras y gráficos de columnas con Seaborn publicado el julio 18, 2023 | en Python
  • pandas Pandas: Cambiar los tipos de datos en los DataFrames publicado el julio 15, 2021 | en Python
  • Instantáneas de VirtualBox (Snapshots) publicado el marzo 27, 2019 | en Herramientas

Publicidad

Lo mejor valorado

4.9 (24)

Seleccionar filas y columnas en Pandas con iloc y loc

4.6 (16)

Archivos JSON con Python: lectura y escritura

4.4 (14)

Ordenación de diccionarios en Python mediante clave o valor

4.7 (13)

Operaciones de filtrado de DataFrame con Pandas en base a los valores de las columnas

4.5 (10)

Diferencias entre var y let en JavaScript

Publicidad

Comentarios recientes

  • Daniel Rodríguez en Probabilidad básica: cómo entender el azar en nuestra vida diaria
  • Pepe en Probabilidad básica: cómo entender el azar en nuestra vida diaria
  • CARLOS ARETURO BELLO CACERES en Justicio: La herramienta gratuita de IA para consultas legales
  • Piera en Ecuaciones multilínea en Markdown
  • Daniel Rodríguez en Tutorial de Mypy para Principiantes

Publicidad


Footer

Analytics Lane

  • Acerca de Analytics Lane
  • Boletín de noticias
  • Contacto
  • Libros
  • Lo más popular
  • Noticias
  • Tienda
  • Tiendas afiliadas

Secciones

  • Ciencia de datos
  • Criptografía
  • Herramientas
  • Machine Learning
  • Opinión
  • Productividad
  • Programación
  • Reseñas

Sobre de Analytics Lane

En Analytics Lane tratamos de explicar los principales conceptos de la ciencia e ingeniería de datos con un enfoque práctico. Los principales temas tratados son ciencia de datos, ingeniería de datos, inteligencia artificial, machine learning, deep learning y criptografía. Además, también se habla de los principales lenguajes de programación y herramientas utilizadas por los científicos e ingenieros de datos.

Copyright © 2018-2025 Analytics Lane ·Términos y condiciones ·Política de Cookies ·Política de Privacidad ·Herramientas de privacidad ·Contacto