En los procesos de toma de decisiones el término sesgo tiene generalmente connotaciones negativas. No es deseable que un proceso automático lo tenga de ningún tipo. La palabra sesgo procede de sesgar, un verbo que hace referencia a torcer o atravesar algo hacia uno de sus lados. Por lo que una decisión sesgada, que se tuerce en algún sentido, no es deseable. Los modelos de … [Leer más...] acerca de ¿Qué es el sesgo en aprendizaje automático?
Ciencia de datos
La ciencia de datos es un área de conocimiento interdisciplinar en el cual se utilizan procesos para recopilar, preparar, analizar, visualizar y modelar datos para extraer todo su valor. Pudiéndose emplear tanto con conjuntos de datos estructurados como no estructurados. Los científicos de datos, los profesionales de esta área deben poseer grandes conocimientos de estadística e informática. Además de conocimiento de los procesos que están modelando.
Con la ciencia de datos es posible revelar tendencias y obtener información para que tanto las empresas como las instituciones puedan tomar mejores decisiones. Basando estas así en conocimiento validado no en intuiciones.
Las publicaciones de esta sección abarca diferentes temas de áreas como la estadística, la minería de datos, el aprendizaje automático y la analítica predictiva.
5 libros para Data Science
Hoy, día del libro, es una excelente oportunidad para recopilar libros imprescindibles para Data Science. Estos son libros que todo científico de datos, tanto sea usuario de Python como R, deberían conocer y leer.Python Data Science Handbook de Jake VanderPlasPython es actualmente el lenguaje de referencia para los científicos de datos. Algo que se puede apreciar en … [Leer más...] acerca de 5 libros para Data Science
Comparación entre la regresión logística y SVM (máquinas de vectores de soporte)
Unos de los problemas más habituales en aprendizaje automático son los problemas de clasificación. El objetivo en este tipo de problemas es asignar la clase correcta a cada uno de los registros de un conjunto de datos. Un caso particular de estos es la clasificación binaria, en el que solamente existen dos clases que suelen etiquetadas como verdadero y falso. Los algoritmos de … [Leer más...] acerca de Comparación entre la regresión logística y SVM (máquinas de vectores de soporte)
Implementación del método descenso del gradiente en Python
Una de las fases clave en los proyectos de aprendizaje automático es el entrenamiento de los modelos. El futuro rendimiento de los modelos dependerá en gran medida del éxito en esta fase. En esta es necesario identificar los parámetros de un modelo o método de aprendizaje automático con los que se consigue el máximo rendimiento sobre el conjunto de datos de entrenamiento. … [Leer más...] acerca de Implementación del método descenso del gradiente en Python
¿Qué es el análisis de clúster?
El término análisis de clúster hace referencia a la familia de algoritmos que permiten agrupar registros similares de un conjunto de datos en grupos. A cada uno de estos grupos es a lo que se denomina un clúster. El objetivo final del análisis es asignar a cada clúster los registros que son similares entre sí. Al mismo tiempo que los registros del resto de clústeres son … [Leer más...] acerca de ¿Qué es el análisis de clúster?
La exactitud y la precisión en modelos de clasificación
En los modelos de clasificación, unos de los indicadores que se utilizan para seleccionar uno u otro son la exactitud (en inglés “precision”) y la exhaustividad (en inglés “recall”). La exactitud y la exhaustividad son una forma simple de medir la calidad de las predicciones realizadas.La matriz de confusiónEn los problemas de clasificación los resultados se suelen … [Leer más...] acerca de La exactitud y la precisión en modelos de clasificación
Diferencias entre regresión y clasificación en aprendizaje automático
Dentro del aprendizaje automático existen dos grandes familias de algoritmos: el aprendizaje supervisado y el aprendizaje no supervisado. En la primera de ellos los modelos son entrenados a partir de un conjunto de datos en el que la respuesta correcta es conocida. Siendo la finalidad del entrenamiento conseguir que los modelos reproduzcan este a partir de las características … [Leer más...] acerca de Diferencias entre regresión y clasificación en aprendizaje automático
La interpretación de las redes neuronales
Las redes neuronales profundas han demostrado ser una de las herramientas más potentes a la hora de realizar predicciones. Existen pocas técnicas en el aprendizaje automático que permitan alcanzar el nivel de precisión que ofrecen estas. Por eso no es de extrañar que el número de casos de éxito en los que son utilizadas no haga más que aumentar. Aún así, su utilización es … [Leer más...] acerca de La interpretación de las redes neuronales
¿Por qué limitar el número de unidades en una oferta?
En algunos mercados es habitual encontrar ofertas comerciales en las que se limitan las unidades que un cliente puede adquirir. Esta limitación se fija para evitar que los primeros clientes puedan agotar el stock disponible. Unos clientes que ante las dimisiones de la oferta puedan realizar acopio de una gran cantidad de producto. Así se puede alegar que se desea llegar al … [Leer más...] acerca de ¿Por qué limitar el número de unidades en una oferta?
Preguntas en formularios: anclaje
Esta entrada finaliza la serie en la que se revisan diferentes efectos que se han de tener en cuenta a la hora de diseñar formularios o workshops. Comenzó con una entrada sobre la interpretación que puede existir al preguntar sobre tendencia. En la siguiente se ha discutido los efectos del entorno en la precisión. La tercera ha sido analizado los fenómenos de pastoreo y … [Leer más...] acerca de Preguntas en formularios: anclaje
Preguntas en formularios: pastoreo y auto-pastoreo
En entradas anteriores fue explicado cómo pueden afectar a la respuesta la forma de preguntar cuándo se pregunta sobre la tendencia y el efecto del entorno. En esta tercera entrada se va a analizar el efecto de pastoreo y auto-pastoreo que suele aparecer especialmente en los workshops. Esto dos efectos están relacionados ya que las nuevas respuestas se basan en las anteriores. … [Leer más...] acerca de Preguntas en formularios: pastoreo y auto-pastoreo
Preguntas en formularios: precisión y entorno
En una entrada anterior se explico cómo puede afectar la forma de preguntar a las respuestas obtenidas cuando se pregunta sobre tendencia. En esta nueva entrada se explicará el efecto que puede tener el entorno en la precisión de los valores obtenidos. Analizando cómo se puede relacionar la precisión y entorno.Las herramientas empleadas para la realización de medidas de … [Leer más...] acerca de Preguntas en formularios: precisión y entorno