Al hablar de arquitecturas de almacenamiento de datos en las organizaciones es habitual encontrarse con tres diferentes opciones: Data Lake, Data Warehouse y Data Mart. Aunque pudieran parecer diferentes nombres para una base de datos, no es así. Existen importantes diferencias conceptuales entre ellas que es importante conocer.Data LakeUn Data Lake (lago de datos) es … [Leer más...] acerca de Arquitecturas de almacenamiento de datos: Data Lake, Data Warehouse y Data Mart
Ciencia de datos
La ciencia de datos es un área de conocimiento interdisciplinar en el cual se utilizan procesos para recopilar, preparar, analizar, visualizar y modelar datos para extraer todo su valor. Pudiéndose emplear tanto con conjuntos de datos estructurados como no estructurados. Los científicos de datos, los profesionales de esta área deben poseer grandes conocimientos de estadística e informática. Además de conocimiento de los procesos que están modelando.
Con la ciencia de datos es posible revelar tendencias y obtener información para que tanto las empresas como las instituciones puedan tomar mejores decisiones. Basando estas así en conocimiento validado no en intuiciones.
Las publicaciones de esta sección abarca diferentes temas de áreas como la estadística, la minería de datos, el aprendizaje automático y la analítica predictiva.
Usar ChatGPT en Python
La semana pasada analicé cómo puede ayudar a los científicos de datos el uso de ChatGPT, comprobando que este puede implementar rápidamente análisis de datos y modelos básicos. Para lo que utilice la aplicación de chat disponible en la propia web de OpenAI. Otro método para acceder a ChatGPT es empleando el API que ofrece OpenAI, lo que permite integrar fácilmente el modelo en … [Leer más...] acerca de Usar ChatGPT en Python
Interpretación de las predicciones de los árboles de regresión y Random Forest
Una de las ventajas de usar árboles de regresión es su interpretabilidad. Cuando se crea un modelo a partir de un árbol de regresión no solamente se puede obtener una predicción para cada uno de los registros, sino que también es posible saber cuánto afecta cada una de las características usadas al resultado final. Aunque esto no se puede hacer directamente en Scikit-learn. … [Leer más...] acerca de Interpretación de las predicciones de los árboles de regresión y Random Forest
Implementar modelos de aprendizaje automático con ChatGPT
ChatGPT es un modelo de lenguaje desarrollado por OpenAI que puede producir respuestas a las cuestiones que se le plantean de forma similar a como lo haría un humano. Con capacidad de comprender el contexto de las preguntas y seguir una conversación. Por lo que es capaz ampliar o corregir las respuestas generadas anteriormente dentro de una conversación en base a las cuestiones … [Leer más...] acerca de Implementar modelos de aprendizaje automático con ChatGPT
Paquetes con el algoritmo Apriori en Python
El algoritmo Apriori es uno de los más empleados para la creación de reglas de asociación. A pesar de ello, no existe un paquete que se puede considerar el "estándar" en Python, como sucede con el caso de arules en R. En esta ocasión voy a analizar algunos paquetes que se pueden encontrar en PyPi en los que se implementa el algoritmo Apriori en Python para tener una comparativa … [Leer más...] acerca de Paquetes con el algoritmo Apriori en Python
Cómo funciona k-modes e implementación en Python
La semana pasada publiqué un artículo donde explicaba el funcionamiento del algoritmo de k-means o k-medias junto a una implementación básica en Python. Este algoritmo es uno de los más utilizados para análisis de clúster. Aunque cuenta con un problema importante, al estar basado en la métrica euclídea solamente se puede utilizar cuando todas las características del conjunto de … [Leer más...] acerca de Cómo funciona k-modes e implementación en Python
Cómo funciona k-means e implementación en Python
El algoritmo de k-means o k-medias es uno de los más utilizados dentro del análisis de clúster. Algo que se puede explicar porque este es un algoritmo sencillo, fácil de interpretar y generalmente ofrece buenos resultados en la mayoría de los conjuntos de datos. Por lo que suele estar implementado en la mayoría de las librerías estadísticas y de aprendizaje automático como … [Leer más...] acerca de Cómo funciona k-means e implementación en Python
El método de Newton e implementación en Python
El método de Newton es un algoritmo numérico mediante el cual se puede buscar las raíces de las funciones que emplea la derivada para iterar hacia la solución. Obteniendo generalmente el resultado en menos pasos que los métodos basados en la bisección o la secante. La implementación del método de Newton requiere conocer la derivada de la función, por lo que esta ha de ser … [Leer más...] acerca de El método de Newton e implementación en Python
El método de la secante e implementación en Python
Un algoritmo alternativo al de la bisección para la búsqueda de raíces es el método de la secante. Generalmente es un método más eficiente ya que, mientras el primero utiliza el punto intermedio para buscar el punto de corte y aproximar la raíz, el método de la secante emplea como aproximación la secante para buscar la solución. Siendo esta una aproximación de la forma de la … [Leer más...] acerca de El método de la secante e implementación en Python
Representar los criterios de selección en árboles de decisión
La representación de árboles de decisión es un tema del que ya se ha publicado con antelación en el blog. En su momento de ha visto los pasos necesarios para generar representaciones gráficas y de texto con las librerías PyDotPlus y Scikit-Learn. Aunque también existen otras librerías como dtreeviz, la que veremos hoy. Una librería con la que es posible representar los … [Leer más...] acerca de Representar los criterios de selección en árboles de decisión
Factores que pueden afectar a la elasticidad de la demanda
La elasticidad de la demanda es un parámetro clave a la hora de fijar los precios de un bien o servicio. Aumentar el precio de una referencia elástica puede hacer que la demanda se reduzca demasiado afectando a las estimaciones. Mientras que en las referencias inelásticas la variación es menor. Pero el precio no es el único factor que puede afectar a la elasticidad de la … [Leer más...] acerca de Factores que pueden afectar a la elasticidad de la demanda
Tipos de elasticidad de la demanda en función del precio
La variación que sufre la demanda ante un cambio de precio es lo que se conoce en económica como elasticidad, un valor clave que se debe tener en cuenta a la hora de fijar los precios de un bien o servicio. Pero ¿qué tipos de elasticidad de la demanda existen?ElasticidadLa elasticidad se define como la variación observada en la demanda de un producto o servicio respecto … [Leer más...] acerca de Tipos de elasticidad de la demanda en función del precio











