Un algoritmo alternativo al de la bisección para la búsqueda de raíces es el método de la secante. Generalmente es un método más eficiente ya que, mientras el primero utiliza el punto intermedio para buscar el punto de corte y aproximar la raíz, el método de la secante emplea como aproximación la secante para buscar la solución. Siendo esta una aproximación de la forma de la … [Leer más...] acerca de El método de la secante e implementación en Python
Ciencia de datos
La ciencia de datos es un área de conocimiento interdisciplinar en el cual se utilizan procesos para recopilar, preparar, analizar, visualizar y modelar datos para extraer todo su valor. Pudiéndose emplear tanto con conjuntos de datos estructurados como no estructurados. Los científicos de datos, los profesionales de esta área deben poseer grandes conocimientos de estadística e informática. Además de conocimiento de los procesos que están modelando.
Con la ciencia de datos es posible revelar tendencias y obtener información para que tanto las empresas como las instituciones puedan tomar mejores decisiones. Basando estas así en conocimiento validado no en intuiciones.
Las publicaciones de esta sección abarca diferentes temas de áreas como la estadística, la minería de datos, el aprendizaje automático y la analítica predictiva.
Representar los criterios de selección en árboles de decisión
La representación de árboles de decisión es un tema del que ya se ha publicado con antelación en el blog. En su momento de ha visto los pasos necesarios para generar representaciones gráficas y de texto con las librerías PyDotPlus y Scikit-Learn. Aunque también existen otras librerías como dtreeviz, la que veremos hoy. Una librería con la que es posible representar los … [Leer más...] acerca de Representar los criterios de selección en árboles de decisión
Factores que pueden afectar a la elasticidad de la demanda
La elasticidad de la demanda es un parámetro clave a la hora de fijar los precios de un bien o servicio. Aumentar el precio de una referencia elástica puede hacer que la demanda se reduzca demasiado afectando a las estimaciones. Mientras que en las referencias inelásticas la variación es menor. Pero el precio no es el único factor que puede afectar a la elasticidad de la … [Leer más...] acerca de Factores que pueden afectar a la elasticidad de la demanda
Tipos de elasticidad de la demanda en función del precio
La variación que sufre la demanda ante un cambio de precio es lo que se conoce en económica como elasticidad, un valor clave que se debe tener en cuenta a la hora de fijar los precios de un bien o servicio. Pero ¿qué tipos de elasticidad de la demanda existen?ElasticidadLa elasticidad se define como la variación observada en la demanda de un producto o servicio respecto … [Leer más...] acerca de Tipos de elasticidad de la demanda en función del precio
Seleccionar las mejores características para un modelo con Scikit-learn
Cuando trabajamos con conjuntos de datos es habitual que no todas las características sean significativas, por lo que incluirlas puede ser más perjudicial que beneficioso para un modelo de aprendizaje automático. Por eso es importante seleccionar las mejores características. En Scikit-learn existen varias herramientas para ello, siendo una de las más sencillas de utilizar … [Leer más...] acerca de Seleccionar las mejores características para un modelo con Scikit-learn
Representar árboles de decisiones con Scikit-Learn
Los árboles de decisión son una familia de algoritmos de aprendizaje supervisados ampliamente utilizados debido a que, a pesar de su simplicidad, pueden realizan buenas predicciones en una amplia variedad de problemas. Además, la simplicidad de su planteamiento hace que sus resultados sean fácilmente interpretables. Permitiendo no solo obtener predicciones relevantes, sino … [Leer más...] acerca de Representar árboles de decisiones con Scikit-Learn
El método de la bisección e implementación en Python
Uno de los métodos numéricos para buscar la raíz de una función más sencillo es el de la bisección. Siendo también uno de los más fáciles de implementar en un programa. El método de la bisección se puede utilizar en funciones continuas que cambian de signo en un rango de valores y solamente tienen una raíz en el mismo. Basándose para ello en una idea sencilla: dividir el rango … [Leer más...] acerca de El método de la bisección e implementación en Python
Calcular el número óptimo de bins para un histograma
Los histogramas son una herramienta fantástica para visualizar la frecuencia de los diferentes valores de un conjunto de datos. Permitiendo ver rápidamente la distribución de la población. Lo que se hace dividiendo el rango del conjunto de datos en grupos de la misma anchura, a los que se suelen denominar bins, y contar el número de valores que caen en cada uno de estos. Siendo … [Leer más...] acerca de Calcular el número óptimo de bins para un histograma
¿Es sostenible la ciencia de datos basada en Software Libre?
A finales del año pasado saltaba la noticia de la existencia de una vulnerabilidad crítica en Apache Log4j, afectando a millones de aplicaciones y servicios que usaban esta librería para la creación de los logs. Poniendo en jaque a miles de pequeñas, medianas y grandes empresas. La gravedad del fallo de seguridad se puede ver en el hecho de que la noticia ha llegado a las … [Leer más...] acerca de ¿Es sostenible la ciencia de datos basada en Software Libre?
Escalabilidad para Machine Learning
El concepto de escalabilidad es algo cada día más importante a la hora de desarrollar nuevas soluciones tecnológicas, incluidas en las que se implementan modelos de Aprendizaje Automático o Machine Learning. De poco sirve disponer del mejor modelo si cuando es necesario no es posible escalar para responder a toda la demanda. Esto es, si no se puede resolver en plazo todas las … [Leer más...] acerca de Escalabilidad para Machine Learning
Los tipos de aprendizaje por conjuntos (Ensemble Learning)
Al evaluar y comparar el rendimiento de diferentes modelos de aprendizaje automático es habitual observar que las mejores predicciones no siempre proceden del mismo modelo. En un subconjunto de datos los mejores resultados los ofrece la regresión lineal, pero en otro funcionan mejor los árboles de decisión. Lo que indica que el mejor modelo sería una combinación de los mejores. … [Leer más...] acerca de Los tipos de aprendizaje por conjuntos (Ensemble Learning)