• Ir al contenido principal
  • Skip to secondary menu
  • Ir a la barra lateral primaria
  • Ir al pie de página
  • Inicio
  • Secciones
    • Ciencia de datos
    • Criptografía
    • Herramientas
    • Noticias
    • Opinión
  • Programación
    • JavaScript
    • Julia
    • Matlab
    • Python
    • R
  • Boletín
  • Contacto
  • Acerca de Analytics Lane
  • Tienda
    • Libros
    • Equipamiento de oficina
    • Equipamiento en movilidad
    • Tiendas afiliadas
      • AliExpress
      • Amazon
      • GearBest
      • GeekBuying
      • JoyBuy

Analytics Lane

Ciencia e ingeniería de datos aplicada

  • Ciencia de datos
  • Criptografía
  • Python
  • Matlab
  • R
  • Julia
  • JavaScript
  • Herramientas
  • Opinión
  • Noticias

Python

Python es un lenguaje de programación interpretado con una filosofía basada en la legibilidad del código. Un lenguaje que gracias posee un gran ecosistema de librerías para la ciencia de datos. Por lo que es uno de los más populares en la actualidad entre los científicos de datos. Además, es uno de los lenguajes más deseados y adorados por los programadores según las encuestas de Stack Overflow.

Python es un lenguaje de programación interpretado de propósito general que obliga al uso de una sintaxis clara, gracias a la cual el código es altamente legible. Siendo un lenguaje potente y fácil de aprender. Además, permite utilizar múltiples paradigmas de programación. Lo que permite usar desde programación orientada a objetos, pasando por programación imperativa o funcional.

Los paquetes de Python más utilizados por los científicos son:

  • NumPy: permite el tratamiento de datos basados en matrices,
  • Pandas: ideal para la manipulación de datos heterogéneos mediante objetos DataFrame,
  • SciPy: implementa tareas habituales en computación científica,
  • Matplotlib: facilita la visualización de datos y scikit-learn creación de modelos de aprendizaje automático.

Las publicaciones de esta sección versan sobre estas librerías y las bases del lenguaje.

Visualización de datos en Python con Seaborn

julio 20, 2018 Por Daniel Rodríguez Dejar un comentario

Seaborn es una librería para Python que permite generar fácilmente elegantes gráficos. Seaborn esta basada en matplotlib y proporciona una interfaz de alto nivel que es realmente sencilla de aprender. Dada su gran popularidad se encuentra instalada por defecto en la distribución Anaconda.La representación de datos es una tarea clave del análisis de datos. La utilización de … [Leer más...] acerca deVisualización de datos en Python con Seaborn

Archivos JSON con Python: lectura y escritura

julio 16, 2018 Por Daniel Rodríguez 2 comentarios

Codificación JSON

El formato de archivo JSON es uno de los más populares en los últimos años para serializar de datos. Los archivos de este formato se pueden obtener como resultados de la mayoría de las aplicaciones API REST y otras aplicaciones web. Debido a su gran popularidad es cada vez más probable que se necesite leer o escribir archivos JSON con Python.En Python el formato JSON se … [Leer más...] acerca deArchivos JSON con Python: lectura y escritura

Introducción a las pruebas unitarias en Python

julio 11, 2018 Por Daniel Rodríguez Dejar un comentario

Test

Las pruebas unitarias son clave para poder garantizar la calidad del cualquier código. Al escribir pruebas unitarias se automatiza el control de calidad, al mismo tiempo que se crea una documentación viva de las funcionalidades y APIs implementadas. En esta entrada es realiza una introducción a la escritura de pruebas unitarias en Python utilizando la librería unittest.¿Por … [Leer más...] acerca deIntroducción a las pruebas unitarias en Python

Agrupación de datos por fecha en pandas

julio 6, 2018 Por Daniel Rodríguez Dejar un comentario

Fechas

A la hora de analizar conjuntos de datos es habitual encontrarse con series temporales. En estas ocasiones suele ser interesante poder obtener de una forma rápida información estadística de los registros, como puede el número de ocurrencias por mes. En Python se encuentran disponibles diferentes herramientas para poder realizar la agrupación por fecha en pandas. Conocer el … [Leer más...] acerca deAgrupación de datos por fecha en pandas

GridSearchCV

julio 2, 2018 Por Daniel Rodríguez 1 comentario

Puntos

GridSearchCV es una clase disponible en scikit-learn que permite evaluar y seleccionar de forma sistemática los parámetros de un modelo. Indicándole un modelo y los parámetros a probar, puede evaluar el rendimiento del primero en función de los segundos mediante validación cruzada. En caso de que se desee evaluar modelos con parámetros aleatorios existe el método … [Leer más...] acerca deGridSearchCV

Eliminar filas o columnas con valores nulos en Python

junio 29, 2018 Por Daniel Rodríguez Dejar un comentario

Código fuente

La existencia de valores nulos en cualquier conjunto de datos supone un problema a la hora de realizar cualquier análisis. Saber cómo eliminar estos valores de manera fácil es clave de cara a automatizar los procesos de análisis. En esta entrada se va a explicar la forma de eliminar las filas o columnas que contenga valores nulos en Python. En primer lugar, se explicará la … [Leer más...] acerca deEliminar filas o columnas con valores nulos en Python

Procesado de cadenas de texto en Python

junio 27, 2018 Por Daniel Rodríguez Dejar un comentario

Procesado de texto

Los usuarios que llegan a Python desde otros lenguajes de programación a veces encuentran problemático que no existan funciones para la obtención de subcadenas de texto. Debido a que este tipo de análisis se han de realizar con cierta frecuencia. Por ejemplo, en R se dispone de la función substring con la que se puede obtener fácilmente subcadenas de texto o reemplazar estas … [Leer más...] acerca deProcesado de cadenas de texto en Python

Eliminar registros duplicados en pandas

junio 20, 2018 Por Daniel Rodríguez 2 comentarios

Duplicado

Un problema habitual en los conjuntos de datos es la existencia de registros duplicados. La duplicidad puede ser del registro completo o solamente de unos elementos. Por ejemplo, se ha registrado dos veces la misma operación con diferente identificador. Saber cómo eliminar estos registros duplicados es imprescindible para evitar posibles errores en los análisis posteriores. En … [Leer más...] acerca deEliminar registros duplicados en pandas

Guardar y leer archivos CSV con Python

junio 15, 2018 Por Daniel Rodríguez Dejar un comentario

Archivos

Uno de los formatos más utilizados en la actualidad para intercambio de datos es CSV ("Comma Separated Values"). Estas son básicamente archivos de texto en los que cada línea contiene una fila de datos con múltiples registros delimitados por un separador. Tradicionalmente el separador suele ser la coma, de ahí el nombre del formato. Aunque también se pueden utilizan otros … [Leer más...] acerca deGuardar y leer archivos CSV con Python

Instalación de varias versiones de Python en Anaconda

mayo 16, 2018 Por Daniel Rodríguez Dejar un comentario

Anaconda

La existencia de dos versiones de Python, la 2.x y la 3.x, incompatibles entre sí genera que muchas veces no encontremos con librerías que no son compatibles con nuestra versión. En caso de que tengamos este problema es una buena idea instalar más de una versión en nuestros ordenadores.Anaconda posiblemente sea la distribución de Python por excelencia para los que … [Leer más...] acerca deInstalación de varias versiones de Python en Anaconda

Archivos comprimidos en Python

mayo 4, 2018 Por Daniel Rodríguez Dejar un comentario

Archivadores

El otro día hablamos de la posibilidad de importar los datos directamente desde archivos comprimidos en R, permitiendo ahorrar un espacio importante a la hora de almacenar nuestros proyectos o recuperarlos de la red. Esta funcionalidad también se puede encontrar en la librería pandas de Python. La función pd.read_csv realiza esta tarea de forma automática al importar un archivo … [Leer más...] acerca deArchivos comprimidos en Python

  • « Ir a la página anterior
  • Ir a la página 1
  • Páginas intermedias omitidas …
  • Ir a la página 8
  • Ir a la página 9
  • Ir a la página 10

Barra lateral primaria

Suscríbete a nuestro boletín

Suscríbete al boletín semanal para estar al día de todas las publicaciones.

Política de Privacidad

¡Síguenos en redes sociales!

  • facebook
  • github
  • telegram
  • pinterest
  • rss
  • tumblr
  • twitter
  • youtube

Publicidad

Tiendas afiliadas

Ayúdanos realizando tus compras sin coste adicional con los enlaces de la tienda. ¡Gracias!

Entradas recientes

Usar dispositivos USB en VirtualBox

enero 15, 2021 Por Daniel Rodríguez Dejar un comentario

Eliminar elementos en matrices de Matlab

enero 13, 2021 Por Daniel Rodríguez Dejar un comentario

NumPy

NumPy: Crear matrices vacías en NumPy y adjuntar filas o columnas

enero 11, 2021 Por Daniel Rodríguez Dejar un comentario

Publicidad

Es tendencia

  • Tablas dinámicas en Python con pandas bajo Python
  • ¿Cómo eliminar columnas y filas en un dataframe pandas? bajo Python
  • ¿Cómo cambiar el nombre de las columnas en Pandas? bajo Python
  • Unir y combinar dataframes con pandas en Python bajo Python
  • Numpy básico: como añadir elementos en arrays de Numpy con np.append() bajo Python

Publicidad

Lo mejor valorado

5 (3)

Ordenar una matriz en Matlab en base a una fila o columna

5 (3)

Automatizar el análisis de datos con Pandas-Profiling

5 (5)

Diferencias entre var y let en JavaScript

5 (6)

Operaciones de filtrado de DataFrame con Pandas en base a los valores de las columnas

5 (3)

Unir y combinar dataframes con pandas en Python

Publicidad

Comentarios recientes

  • Daniel Rodríguez en Calculadora de probabilidades de ganar a la lotería
  • abel en Calculadora de probabilidades de ganar a la lotería
  • David Arias en Diferencias entre regresión y clasificación en aprendizaje automático
  • Juan Aguilar en Archivos JSON con Python: lectura y escritura
  • Camilo en Contar palabras en una celda Excel

Publicidad

Footer

Secciones

  • Ciencia de datos
  • Criptografía
  • Herramientas
  • Noticias
  • Opinión

Programación

  • JavaScript
  • Julia
  • Matlab
  • Python
  • R

Analytics Lane

  • Acerca de Analytics Lane
  • Boletín de noticias
  • Contacto
  • Lo más popular
  • Tienda

Tiendas Afiliadas

  • AliExpress
  • Amazon
  • BangGood
  • GearBest
  • Geekbuying
  • JoyBuy

Sobre de Analytics Lane

En Analytics Lane tratamos de explicar los principales conceptos de la ciencia e ingeniería de datos con un enfoque práctico. Los principales temas tratados son ciencia de datos, ingeniería de datos, inteligencia artificial, machine learning, deep learning y criptografía. Además, también se habla de los principales lenguajes de programación y herramientas utilizadas por los científicos e ingenieros de datos.

Tiendas afiliadas

Ayúdanos realizando tus compras sin coste adicional con los enlaces de la tienda. ¡Gracias!

Amazon

2018-2020 Analytics Lane · Términos y condiciones · Política de Cookies · Política de Privacidad · Herramientas de privacidad · Contacto