• Saltar al contenido principal
  • Skip to secondary menu
  • Saltar a la barra lateral principal
  • Saltar al pie de página
  • Inicio
  • Secciones
    • Ciencia de datos
    • Criptografía
    • Herramientas
    • Machine Learning
    • Noticias
    • Opinión
    • Productividad
    • Programación
      • JavaScript
      • Julia
      • Matlab
      • Python
      • R
  • Programación
    • JavaScript
    • Julia
    • Matlab
    • Python
    • R
  • Laboratorio
    • Estadística
      • Calculadora del Tamaño Muestral en Encuestas
      • Calculadora de estadísticos descriptivos
      • Test de normalidad
      • Calculadora de contrastes de hipotesis
      • Calculadora de tamano del efecto
      • Simulador de Regresión Lineal con Ruido
      • Visualizador de PCA
      • Visualizador de Series Temporales
      • Simulador de Regresión Logística
      • Simulador de K-Means
      • Simulador de DBSCAN
      • Detector de la Ley de Benford
    • Probabilidad
      • Calculadora de Probabilidad de Distribuciones
      • Calculadora de Probabilidades de Lotería
      • Simulador del Problema de Monty Hall
      • Simulador de la Estrategia Martingala
    • Finanzas
      • Calculadora de Préstamos e Hipotecas
      • Conversor TIN ↔ TAE
      • Calculadora DCA con ajuste por inflación
      • Calculadora XIRR con Flujos Irregulares
      • Simulador FIRE (Financial Independence, Retire Early)
    • Negocios
      • CLV
      • Scoring
    • Herramientas
      • Formateador / Minificador de JSON
      • Conversor CSV ↔ JSON
      • Comparador y Formateador de Texto y JSON
      • Formateador y Tester de Expresiones Regulares
      • Inspector de JWT
      • Generador y verificador de hashes
      • Codificador / Decodificador Base64 y URL
      • Conversor de bases numericas
      • Conversor de Timestamp Unix
      • Conversor de colores
      • Generador de UUIDs
    • Juegos
      • Tres en Raya
      • Nim con Q-Learning
    • Más
      • Método D’Hondt
      • Generador de Contraseñas Seguras
  • Noticias
  • Boletín
  • Contacto
  • Tienda
    • Libros
    • Equipamiento de oficina
    • Equipamiento en movilidad

Analytics Lane

Ciencia e ingeniería de datos aplicada

  • Ciencia de datos
  • Machine Learning
  • IA Generativa
  • Python
  • Pandas
  • NumPy
  • R
  • Excel

Python

Python es un lenguaje de programación interpretado con una filosofía basada en la legibilidad del código. Un lenguaje que gracias posee un gran ecosistema de librerías para la ciencia de datos. Por lo que es uno de los más populares en la actualidad entre los científicos de datos. Además, es uno de los lenguajes más deseados y adorados por los programadores según las encuestas de Stack Overflow.

Python es un lenguaje de programación interpretado de propósito general que obliga al uso de una sintaxis clara, gracias a la cual el código es altamente legible. Siendo un lenguaje potente y fácil de aprender. Además, permite utilizar múltiples paradigmas de programación. Lo que permite usar desde programación orientada a objetos, pasando por programación imperativa o funcional.

Los paquetes de Python más utilizados por los científicos son:

  • NumPy: permite el tratamiento de datos basados en matrices,
  • Pandas: ideal para la manipulación de datos heterogéneos mediante objetos DataFrame,
  • SciPy: implementa tareas habituales en computación científica,
  • Matplotlib: facilita la visualización de datos y scikit-learn creación de modelos de aprendizaje automático.

Las publicaciones de esta sección versan sobre estas librerías y las bases del lenguaje.

¿Cómo eliminar columnas y filas en un dataframe pandas?

marzo 25, 2019 Por Daniel Rodríguez 17 comentarios
Tiempo de lectura: 3 minutos

Al trabajar con grandes conjuntos de datos es habitual tener que eliminar registros para eliminar su tamaño. Por ejemplo, al importar los datos se un archivo CSV puede ser que los registros de algunas columnas no sean necesarios. En esta entrada vamos a explicar cómo eliminar columnas y filas en un dataframe pandas.Para poder eliminar datos de un dataframe es necesario … [Leer más...] acerca de ¿Cómo eliminar columnas y filas en un dataframe pandas?

Comparar los registros de dos dataframes con pandas

marzo 18, 2019 Por Daniel Rodríguez Deja un comentario
Tiempo de lectura: 3 minutos

Al tener dos conjuntos de datos en muchas ocasiones es necesario comparar su contenido. Para saber los registros comunes, los que se han eliminado o los que se han añadido a uno de los conjuntos de datos. En una base de datos esto es una tarea sencilla. En Python los objetos DataFrame dispone del método mergue con el que se puede operar de forma similar a una consulta SQL. … [Leer más...] acerca de Comparar los registros de dos dataframes con pandas

Subir archivos a Dropbox desde Python a través de la API

marzo 11, 2019 Por Daniel Rodríguez Deja un comentario
Tiempo de lectura: 4 minutos

Los servicios de almacenamiento en la nube permiten guardar y recuperar archivos desde casi cualquier dispositivo que disponga de una conexión a internet. Lo que convierte a estos servicios en un repositorio perfecto para almacenar diferentes archivos. Ya que mientras se disponga de una conexión a la red se podrá acceder a los datos. Una de sus posibles aplicaciones puede ser … [Leer más...] acerca de Subir archivos a Dropbox desde Python a través de la API

Mejores aproximaciones para iterar en Python

marzo 4, 2019 Por Daniel Rodríguez 2 comentarios
Tiempo de lectura: 4 minutos

En los entornos intensivos en datos es habitual tener que aplicar una misma función a grandes conjuntos de datos. Los cuales pueden estar almacenados en listas o tuplas. Lo que puede ser necesario desde para la creación de los datos de una gráfica hasta para obtener los valores de una simulación de tipo Montecarlo. Para lo que no existe una única forma de realizar esta tarea, … [Leer más...] acerca de Mejores aproximaciones para iterar en Python

Mapas de calor y diagramas de araña en Python

febrero 25, 2019 Por Daniel Rodríguez Deja un comentario
Tiempo de lectura: 4 minutos

En una entrada anterior se ha visto algunos de los gráficos más importantes disponibles en la librería de Python Seaborn. En esta ocasión se va a ver cómo construir en Python dos tipos de gráficos que pueden ser muy útiles: los mapas de calor y los diagramas de araña. Para construir el primero de ellos se utilizará Seaborn, mientras que para el segundo se utilizará matplotlib. … [Leer más...] acerca de Mapas de calor y diagramas de araña en Python

Seleccionar automáticamente los modelos en Python con GridSearchCV

febrero 18, 2019 Por Daniel Rodríguez Deja un comentario
Tiempo de lectura: 3 minutos

Las clases GridSearchCV y RandomizedSearchCV de Scikit-learn pueden ser utilizadas para automatizar la selección de los parámetros de un modelo. Aplicando para ello la técnica de validación cruzada. Partiendo de un modelo y un conjunto de sus parámetros prueba múltiples combinaciones para identificar aquella que ofrece mayor rendimiento. Proceso que se ha visto en una entrada … [Leer más...] acerca de Seleccionar automáticamente los modelos en Python con GridSearchCV

Fijar la semilla de números aleatorios en Python

febrero 11, 2019 Por Daniel Rodríguez Deja un comentario
Tiempo de lectura: 4 minutos

Los números aleatorios son importantes en muchas aplicaciones. Desde las más básicas como puede ser seleccionar una carta al azar hasta para la creación de simulaciones de Montecarlo. La generación de números aleatorios se basa en una semilla a partir de la cual se crear una serie. En Python, como en otros lenguajes de programación, es posible fijar el valor para obtener los … [Leer más...] acerca de Fijar la semilla de números aleatorios en Python

Automatización del procesado de datos en Scikit-learn con Pipeline

febrero 4, 2019 Por Daniel Rodríguez Deja un comentario
Tiempo de lectura: 3 minutos

En aprendizaje automático la creación de un modelo es un proceso complejo que requiere llevar a cabo múltiples pasos. Siendo la preparación de los datos uno de los que más tiempo requiere. Tras la obtención de un conjunto de datos es necesario aplicarle a este diferentes operaciones antes de poder utilizar un estimador. A modo de ejemplo algunas de las operaciones más … [Leer más...] acerca de Automatización del procesado de datos en Scikit-learn con Pipeline

Instalación de PySpark en Anaconda y primeros pasos

enero 25, 2019 Por Daniel Rodríguez Deja un comentario
Tiempo de lectura: 4 minutos

Apache Spark es una solución de código abierto desarrollado para analizar y procesar datos a gran escala. Para utilizar esta herramienta en Python es necesario utilizar el API PySpark. En esta entrada se explicará cómo realizar la instalación de PySpark en Anaconda y cómo utilizar este desde un Notebook.¿Qué es Apache Spark y PySpark?Apache Spark es un motor de código … [Leer más...] acerca de Instalación de PySpark en Anaconda y primeros pasos

Ejemplo de uso: regresión lineal con rpy2

enero 18, 2019 Por Daniel Rodríguez 4 comentarios
Tiempo de lectura: 3 minutos

En una entrada reciente se ha realizado una introducción a la librería de Python rpy2 con la que es posible utilizar R en Python. La integración de R con Python permite acceder a todos los paquetes disponibles en R sin salir de Python. Obteniendo así un entorno mucho más productivo. En esta ocasión se va a ver un ejemplo de uso de rpy2. Realizando una regresión lineal con rpy2. … [Leer más...] acerca de Ejemplo de uso: regresión lineal con rpy2

Ordenación de diccionarios en Python mediante clave o valor

enero 14, 2019 Por Daniel Rodríguez Deja un comentario
Tiempo de lectura: 3 minutos

Los diccionarios son una estructura de datos muy utilizada en Python debido a gran flexibilidad que ofrecen. A diferencia de las listas o tuplas en las que se accede a los valores mediante un índice, en esta se utiliza una clave. La clave puede ser básicamente cualquier tipo de dato inmutable: enteros, reales, cadenas de texto, tuplas, etc. Lo que permite representar fácilmente … [Leer más...] acerca de Ordenación de diccionarios en Python mediante clave o valor

Utilizar R desde Python con rpy2

enero 11, 2019 Por Daniel Rodríguez 4 comentarios
Tiempo de lectura: 4 minutos

Python dispone de un gran ecosistema para el cálculo numérico, el análisis estadístico y el aprendizaje automático. Siendo el entorno favorito de muchos científicos de datos. Por otro lado, R es también un gran entorno para el análisis estadístico que dispone de una amplia colección de paquetes. A pesar de ellos, cada uno tiene sus ventajas e inconvenientes. Por este motivo … [Leer más...] acerca de Utilizar R desde Python con rpy2

  • « Ir a la página anterior
  • Página 1
  • Páginas intermedias omitidas …
  • Página 29
  • Página 30
  • Página 31
  • Página 32
  • Página 33
  • Página 34
  • Ir a la página siguiente »

Barra lateral principal

Suscríbete a nuestro boletín

Suscríbete al boletín semanal para estar al día de todas las publicaciones.

Política de Privacidad

Analytics Lane en redes sociales

  • Amazon
  • Bluesky
  • Facebook
  • GitHub
  • Instagram
  • Mastodon
  • Pinterest
  • RSS
  • Telegram
  • Tumblr
  • Twitter
  • YouTube

Publicidad

Entradas recientes

Subplots en Matplotlib: cómo organizar múltiples gráficos en una sola figura

mayo 26, 2026 Por Daniel Rodríguez

Síndrome del objeto brillante en ciencia de datos: el error simétrico a los costes hundidos

mayo 21, 2026 Por Daniel Rodríguez

De la Regresión Logística al Scorecard: La Transformación Matemática

mayo 19, 2026 Por Daniel Rodríguez

Publicidad

Es tendencia

  • Creación de gráficos de barras y gráficos de columnas con Seaborn publicado el julio 18, 2023 | en Python
  • Copiar y pegar Activar copiar y pegar en VirtualBox publicado el mayo 1, 2019 | en Herramientas
  • Prueba de independencia de Chi-cuadrado publicado el mayo 6, 2020 | en Ciencia de datos
  • Muestreo de Thompson y BayesUCB para un problema Bandido Multibrazo (Multi-Armed Bandit) publicado el abril 30, 2021 | en Ciencia de datos
  • Excel en Python Guardar y leer archivos Excel en Python publicado el julio 30, 2018 | en Python

Publicidad

Lo mejor valorado

4.9 (24)

Seleccionar filas y columnas en Pandas con iloc y loc

4.6 (16)

Archivos JSON con Python: lectura y escritura

4.4 (14)

Ordenación de diccionarios en Python mediante clave o valor

4.7 (13)

Operaciones de filtrado de DataFrame con Pandas en base a los valores de las columnas

4.1 (11)

Aplicar el método D’Hondt en Excel

Comentarios recientes

  • bif en JSON en bases de datos: cuándo es buena idea y cuándo no
  • bif en Cómo desinstalar Oracle Database 19c en Windows
  • M. Pilar en Cómo eliminar las noticias en Windows 11 y recuperar tu concentración
  • Daniel Rodríguez en Probabilidad básica: cómo entender el azar en nuestra vida diaria
  • Pepe en Probabilidad básica: cómo entender el azar en nuestra vida diaria

Publicidad


Footer

Analytics Lane

  • Acerca de Analytics Lane
  • Boletín de noticias
  • Contacto
  • Libros
  • Lo más popular
  • Noticias
  • Tienda
  • Tiendas afiliadas

Secciones

  • Ciencia de datos
  • Criptografía
  • Herramientas
  • Machine Learning
  • Opinión
  • Productividad
  • Programación
  • Reseñas

Sobre de Analytics Lane

En Analytics Lane tratamos de explicar los principales conceptos de la ciencia e ingeniería de datos con un enfoque práctico. Los principales temas tratados son ciencia de datos, ingeniería de datos, inteligencia artificial, machine learning, deep learning y criptografía. Además, también se habla de los principales lenguajes de programación y herramientas utilizadas por los científicos e ingenieros de datos.

Copyright © 2018-2026 Analytics Lane ·Términos y condiciones ·Política de Cookies ·Política de Privacidad ·Herramientas de privacidad ·Contacto