• Ir al contenido principal
  • Skip to secondary menu
  • Ir a la barra lateral primaria
  • Ir al pie de página
  • Inicio
  • Secciones
    • Ciencia de datos
    • Criptografía
    • Herramientas
    • Noticias
    • Opinión
  • Programación
    • JavaScript
    • Julia
    • Matlab
    • Python
    • R
  • Boletín
  • Contacto
  • Acerca de Analytics Lane
  • Tienda
    • Libros
    • Equipamiento de oficina
    • Equipamiento en movilidad
    • Tiendas afiliadas
      • AliExpress
      • Amazon
      • GearBest
      • GeekBuying
      • JoyBuy

Analytics Lane

Ciencia e ingeniería de datos aplicada

  • Ciencia de datos
  • Criptografía
  • Python
  • Matlab
  • R
  • Julia
  • JavaScript
  • Herramientas
  • Opinión
  • Noticias

Ciencia de datos

La ciencia de datos es un área de conocimiento interdisciplinar en el cual se utilizan procesos para recopilar, preparar, analizar, visualizar y modelar datos para extraer todo su valor. Pudiéndose emplear tanto con conjuntos de datos estructurados como no estructurados. Los científicos de datos, los profesionales de esta área deben poseer grandes conocimientos de estadística e informática. Además de conocimiento de los procesos que están modelando.

Con la ciencia de datos es posible revelar tendencias y obtener información para que tanto las empresas como las instituciones puedan tomar mejores decisiones. Basando estas así en conocimiento validado no en intuiciones.

Las publicaciones de esta sección abarca diferentes temas de áreas como la estadística, la minería de datos, el aprendizaje automático y la analítica predictiva.

El problema de Monty Hall (o de las tres puertas)

julio 8, 2020 Por Daniel Rodríguez Dejar un comentario

El problema de Monty Hall debe su nombre al presentador del popular concurso de televisión "Let's Make a Deal" en el que apareció este juego. Un concursante tiene que escoger entre tres puertas detrás de las que se esconde el premio, en dos de ellas hay una cabra y en la otra un coche. Tras seleccionar una de las puertas Monty Hall, el presentador del programa, abre una de las … [Leer más...] acerca deEl problema de Monty Hall (o de las tres puertas)

La paradoja del cumpleaños

julio 1, 2020 Por Daniel Rodríguez Dejar un comentario

Si tenemos 23 personas en una habitación, ¿cuales son las probabilidades de que por lo menos dos cumplan años el mismo día? Aunque parezca increíble la probabilidad es de un 50%. Siendo este un resultado que se conoce como la paradoja del cumpleaños. De hecho, para obtener una probabilidad del 99,9% solamente es necesario reunir a 75 personas.Calculado las probabilidades en … [Leer más...] acerca deLa paradoja del cumpleaños

La similitud de Jaro–Winkler

junio 24, 2020 Por Daniel Rodríguez Dejar un comentario

La similitud de Jaro–WinklerLa semana pasada hemos se ha visto cómo medir la diferencia entre dos cadenas de texto con la distancia de Levenshtein. Una distancia que mide el número de operaciones necesarias para convertir una cadena de caracteres en otra. Otra distancia que se puede utilizar para medir la similitud entre dos cadenas de texto es la de Jaro–Winkler. Una … [Leer más...] acerca deLa similitud de Jaro–Winkler

La distancia de Levenshtein

junio 17, 2020 Por Daniel Rodríguez Dejar un comentario

Un problema con el que podemos enfrentarnos de forma relativamente habitual es medir el grado de similitud de dos registros. Cuando los registros con los que trabajamos contienen valores numéricos una de las primeras opciones es la distancia euclídea. Pero cuando trabajamos con cadenas de texto deberemos usar otros algoritmos como puede ser el caso de la distancia de … [Leer más...] acerca deLa distancia de Levenshtein

Muestreo en Python

junio 15, 2020 Por Daniel Rodríguez Dejar un comentario

Al trabajar con datos puede que sea necesario realizar una muestra de un conjunto de datos. Esto puede ser porque la totalidad de los datos disponibles sea inmanejable o porque exista un desequilibrio en las clases de los datos. En estos es necesario recurrir al muestreo de los datos. Algunas de las técnicas más utilizadas de muestreo en Python se muestran a … [Leer más...] acerca deMuestreo en Python

Aprendizaje automático para la detección del fraude en seguros

junio 10, 2020 Por Daniel Rodríguez Dejar un comentario

La industria de seguros es un sector muy atractivo para el crimen especializado en fraude. Debido a que, al igual que el caso de banca, las empresas aseguradoras gestionan grandes cantidades de dinero y datos confidenciales de sus asegurados. En este sector, los clientes siempre pueden simular siniestros para acceder al pago de los seguros, lo que puede llevar a grandes … [Leer más...] acerca deAprendizaje automático para la detección del fraude en seguros

Aprendizaje automático para la detección del fraude en comercio electrónico

junio 3, 2020 Por Daniel Rodríguez Dejar un comentario

El comercio electrónico es un área en el que el fraude es cada vez más habitual. Tanto los clientes como los ciberdelincuentes pueden intentar obtener de forma fraudulenta los bienes o servicios comercializados. Afortunadamente este es un sector en el que los datos son abundantes y, por lo tanto, es posible utilizar sistemas de aprendizaje automático para la detección del … [Leer más...] acerca deAprendizaje automático para la detección del fraude en comercio electrónico

Aprendizaje automático para la detección del fraude en banca

mayo 27, 2020 Por Daniel Rodríguez Dejar un comentario

Una de las áreas más atractivas para los criminales es el sector bancario, debido a que gestiona grandes cantidades de dinero y datos privados de los clientes. La disponibilidad de datos permite que el aprendizaje automático sea una herramienta clave para la detección del fraude en banca. Ayudando a evitar pérdidas financieras y de reputación tanto para las entidades … [Leer más...] acerca deAprendizaje automático para la detección del fraude en banca

Prueba exacta de Fisher

mayo 13, 2020 Por Daniel Rodríguez Dejar un comentario

La semana pasada hemos vistos la prueba de independencia de Chi-cuadrado, con la que se puede comprobar la independencia de dos variables cuantitativas. En dicha entrada se comentó que cuando la frecuencia de alguna de las categorías de las variables es pequeña no es aconsejable emplear esta prueba, sino que se debería usar la prueba exacta de Fisher. La cual vamos a explicar … [Leer más...] acerca dePrueba exacta de Fisher

Prueba de independencia de Chi-cuadrado

mayo 6, 2020 Por Daniel Rodríguez Dejar un comentario

En unas entradas anteriores hemos visto los efectos de la multicolinealidad en las variables cuantitativas y como identificar la relación mediante el uso de VIF. Para las variables categóricas también existen pruebas para comprobar si existe relación entre dos, es decir, si los valores de una variable cualitativa dependen de otra. Uno de la prueba más populares es la prueba de … [Leer más...] acerca dePrueba de independencia de Chi-cuadrado

Cursos on-line para comenzar en ciencia de datos

abril 29, 2020 Por Daniel Rodríguez Dejar un comentario

Ahora que medio mundo se encuentra confinado por el coronavirus puede ser el momento para realizar cursos con el que aprender nuevas habilidades o reforzar otras. En la situación actual una de las posibles soluciones es realizar un MOOC ya que no requiere asistir a clase y, en una gran cantidad de los casos, se pueden realizar de forma completamente gratuita. Aunque acceder a … [Leer más...] acerca deCursos on-line para comenzar en ciencia de datos

Solucionar la multicolinealidad con VIF

abril 22, 2020 Por Daniel Rodríguez Dejar un comentario

La multicolinealidad es un problema que afecta negativamente a los modelos de regresión. Cuando existe una relación entre algunas de las variables independientes tanto el proceso de entrenamiento como la interpretación de los modelos se hace más complicado. Por un lado, en el entrenamiento existe más de un parámetro que mejorar las predicciones en el mismo sentido, ya que sus … [Leer más...] acerca deSolucionar la multicolinealidad con VIF

Multicolinealidad

abril 15, 2020 Por Daniel Rodríguez Dejar un comentario

La multicolinealidad es un problema que puede afectar negativamente al rendimiento de los modelos de regresión. Afectando tanto a modelos de regresión lineal como logísticos. El problema aparece cuando existe relación entre las variables independientes empleadas en los modelos. Siendo esta correlación un problema porque las variables independientes deberían de ser … [Leer más...] acerca deMulticolinealidad

Medir la similitud de archivos con Python

marzo 30, 2020 Por Daniel Rodríguez Dejar un comentario

Una de las grandes ventajas de los sistemas informáticos es la facilidad con la que se puede copiar y modificar los archivos. Cuando tenemos que repetir un análisis que ya hemos realizado previamente, sea este en una hoja de cálculo, un Jupyter Notebook o con cualquier otra herramienta, podemos partir de este y modificar adecuadamente los datos. Esto que nos no reinventar los … [Leer más...] acerca deMedir la similitud de archivos con Python

  • Ir a la página 1
  • Ir a la página 2
  • Ir a la página 3
  • Ir a la página 4
  • Ir a la página siguiente »

Barra lateral primaria

Suscríbete a nuestro boletín

Suscríbete al boletín semanal para estar al día de todas las publicaciones.

Política de Privacidad

¡Síguenos en redes sociales!

  • facebook
  • github
  • telegram
  • pinterest
  • rss
  • tumblr
  • twitter
  • youtube

Publicidad

Tiendas afiliadas

Ayúdanos realizando tus compras sin coste adicional con los enlaces de la tienda. ¡Gracias!

Entradas recientes

Creación de un certificado Let’s Encrypt en Windows con Win-Acme

enero 22, 2021 Por Daniel Rodríguez Dejar un comentario

Aplicaciones de Node en producción con PM2

enero 20, 2021 Por Daniel Rodríguez Dejar un comentario

SQLite en Python

enero 18, 2021 Por Daniel Rodríguez Dejar un comentario

Publicidad

Es tendencia

  • ¿Cómo eliminar columnas y filas en un dataframe pandas? bajo Python
  • Intercambiar archivos en VirtualBox bajo Herramientas
  • Excel en Python Guardar y leer archivos Excel en Python bajo Python
  • Operaciones de filtrado de DataFrame con Pandas en base a los valores de las columnas bajo Python
  • Seleccionar elementos en matrices de Matlab bajo Matlab

Publicidad

Lo mejor valorado

5 (3)

Ordenar una matriz en Matlab en base a una fila o columna

5 (3)

Automatizar el análisis de datos con Pandas-Profiling

5 (5)

Diferencias entre var y let en JavaScript

5 (6)

Operaciones de filtrado de DataFrame con Pandas en base a los valores de las columnas

5 (3)

Unir y combinar dataframes con pandas en Python

Publicidad

Comentarios recientes

  • Daniel Rodríguez en Calculadora de probabilidades de ganar a la lotería
  • abel en Calculadora de probabilidades de ganar a la lotería
  • David Arias en Diferencias entre regresión y clasificación en aprendizaje automático
  • Juan Aguilar en Archivos JSON con Python: lectura y escritura
  • Camilo en Contar palabras en una celda Excel

Publicidad

Footer

Secciones

  • Ciencia de datos
  • Criptografía
  • Herramientas
  • Noticias
  • Opinión

Programación

  • JavaScript
  • Julia
  • Matlab
  • Python
  • R

Analytics Lane

  • Acerca de Analytics Lane
  • Boletín de noticias
  • Contacto
  • Lo más popular
  • Tienda

Tiendas Afiliadas

  • AliExpress
  • Amazon
  • BangGood
  • GearBest
  • Geekbuying
  • JoyBuy

Sobre de Analytics Lane

En Analytics Lane tratamos de explicar los principales conceptos de la ciencia e ingeniería de datos con un enfoque práctico. Los principales temas tratados son ciencia de datos, ingeniería de datos, inteligencia artificial, machine learning, deep learning y criptografía. Además, también se habla de los principales lenguajes de programación y herramientas utilizadas por los científicos e ingenieros de datos.

Tiendas afiliadas

Ayúdanos realizando tus compras sin coste adicional con los enlaces de la tienda. ¡Gracias!

Amazon

2018-2020 Analytics Lane · Términos y condiciones · Política de Cookies · Política de Privacidad · Herramientas de privacidad · Contacto