“El interés compuesto es la octava maravilla del mundo. El que lo entiende lo gana y el que no lo paga.” La cita se atribuye a Einstein, aunque probablemente nunca la dijo. No importa, la idea es correcta y el hecho de que se le atribuya a Einstein dice algo sobre cómo percibimos este concepto: como algo casi mágico, reservado para los genios.No es magia. Es aritmética. … [Leer más...] acerca de Interés compuesto: la fuerza que multiplica tu dinero (y los errores que la anulan)
Ciencia de datos
La ciencia de datos es un área de conocimiento interdisciplinar en el cual se utilizan procesos para recopilar, preparar, analizar, visualizar y modelar datos para extraer todo su valor. Pudiéndose emplear tanto con conjuntos de datos estructurados como no estructurados. Los científicos de datos, los profesionales de esta área deben poseer grandes conocimientos de estadística e informática. Además de conocimiento de los procesos que están modelando.
Con la ciencia de datos es posible revelar tendencias y obtener información para que tanto las empresas como las instituciones puedan tomar mejores decisiones. Basando estas así en conocimiento validado no en intuiciones.
Las publicaciones de esta sección abarca diferentes temas de áreas como la estadística, la minería de datos, el aprendizaje automático y la analítica predictiva.
Costes hundidos en ciencia de datos: cuándo mantener un modelo y cuándo migrar
Imagina la situación. Tu equipo lleva tres años con un modelo en producción. No es el estado del arte, pero funciona: predice razonablemente bien, el pipeline de datos está estabilizado, el sistema de monitorización detecta la mayoría de las derivas, y todo el mundo sabe cómo tocarlo sin romper nada. Es el tipo de sistema que genera confianza silenciosa — nadie habla de él … [Leer más...] acerca de Costes hundidos en ciencia de datos: cuándo mantener un modelo y cuándo migrar
WOE e IV: La Base Matemática del Credit Scoring
Cuando un banco evalúa una solicitud de crédito necesita responder a una pregunta aparentemente simple: ¿cuál es la probabilidad de que este cliente no pague? Para responderla dispone de decenas de variables sobre el solicitante — sus ingresos, su edad, el importe que solicita — pero esas variables tienen escalas, unidades y distribuciones completamente distintas. ¿Cómo … [Leer más...] acerca de WOE e IV: La Base Matemática del Credit Scoring
Exactitud, precisión, recall… y los errores que cometemos al interpretarlas en proyectos reales
En dos artículos anteriores hemos intentado explicar qué mide cada métrica de clasificación desde una perspectiva conceptual e intuitiva y cuál deberíamos usar para el problema que queremos resolver en cada caso, viendo a qué pregunta responde cada una de las métricas. En concreto, se han visto los siguientes puntos:Como se puede apreciar, son preguntas distintas. Y, por … [Leer más...] acerca de Exactitud, precisión, recall… y los errores que cometemos al interpretarlas en proyectos reales
¿Qué métrica deberías mirar: exactitud, precisión o recall? Elegir bien empieza por entender el problema
En una entrada anterior vimos que no existen métricas buenas o malas para los modelos de clasificación, sino preguntas mal planteadas. Cada métrica mide algo distinto: el promedio de aciertos, la fiabilidad al predecir, la capacidad para no dejar escapar casos importantes…Pero, una vez entendido eso, a la hora de evaluar un modelo de clasificación, surge la siguiente … [Leer más...] acerca de ¿Qué métrica deberías mirar: exactitud, precisión o recall? Elegir bien empieza por entender el problema
Exactitud, precisión, recall… qué mide realmente cada métrica (y qué no)
Cuando empezamos a trabajar con modelos de clasificación, una de las primeras cosas que aprendemos es a evaluarlos. Necesitamos saber qué bien funcionan. Y casi siempre lo hacemos mirando números. Porcentajes. Métricas con nombres que suenan técnicos y fiables: exactitud, precisión, recall, F1…Pero aquí surge un problema: no el uso de métricas, sino creer que todas miden lo … [Leer más...] acerca de Exactitud, precisión, recall… qué mide realmente cada métrica (y qué no)
Roles en ciencia de datos: Guía completa de perfiles técnicos
En la era digital, los datos se han convertido en uno de los activos más valiosos para cualquier organización. Desde pequeñas startups hasta grandes corporaciones, las empresas buscan transformar sus datos en conocimiento para tomar decisiones más inteligentes, entender mejor a sus clientes y obtener ventajas competitivas. De hecho, en muchas compañías, los datos pueden ser tan … [Leer más...] acerca de Roles en ciencia de datos: Guía completa de perfiles técnicos
JSON en bases de datos: cuándo es buena idea y cuándo no
En los últimos años, el uso de campos JSON en bases de datos ha pasado de ser una rareza técnica a convertirse en una práctica habitual. Prácticamente todos los grandes sistemas gestores de bases de datos relacionales —PostgreSQL, MySQL, SQL Server u Oracle— incorporan hoy tipos de datos específicos para JSON, junto con funciones avanzadas de consulta, indexación y manipulación … [Leer más...] acerca de JSON en bases de datos: cuándo es buena idea y cuándo no
Probabilidad y decisiones: cómo evitar caer en trampas estadísticas del día a día
La probabilidad está presente en casi todas las decisiones que tomamos, aunque no siempre seamos conscientes de ello. Desde contratar un seguro hasta interpretar un resultado médico, pasando por valorar si una oferta realmente compensa o si un riesgo es tan grande como parece. Sin embargo, nuestra intuición sobre el azar suele fallar y esos fallos pueden llevarnos a cometer … [Leer más...] acerca de Probabilidad y decisiones: cómo evitar caer en trampas estadísticas del día a día
El valor esperado: la mejor herramienta que casi nadie usa
Todos los días tomamos decisiones: contratar un seguro, jugar o no a la lotería, aceptar un tratamiento médico, invertir nuestros ahorros, seguir la ruta habitual o buscar una alternativa para evitar el tráfico… Todas estas decisiones tienen algo en común: implican riesgos, posibles beneficios y, en todos los casos, aparece la probabilidad. Para decidir bien existe una … [Leer más...] acerca de El valor esperado: la mejor herramienta que casi nadie usa
Comprender las pruebas de hipótesis para no especialistas
Al leer las conclusiones de un estudio científico, es común encontrarse con afirmaciones como “el resultado fue estadísticamente significativo” o “no se encontraron diferencias significativas”. Pero, ¿qué significan realmente estas expresiones? Y, quizá más importante, ¿cómo se llega a esa conclusión? Detrás de estas frases, presentes en estudios de medicina, economía y muchos … [Leer más...] acerca de Comprender las pruebas de hipótesis para no especialistas
El promedio engañoso: cuando la media no cuenta toda la historia
Al escuchar frases como “el salario promedio es de 2000 €” o “la nota media del alumnado fue de 7”, solemos imaginar que la mayoría de las personas está cerca de ese valor. Pero la realidad rara vez es tan simple. El promedio —o media— puede ocultar grandes desigualdades y dar una imagen distorsionada de la realidad que pretender resumir.En estadística existen varias … [Leer más...] acerca de El promedio engañoso: cuando la media no cuenta toda la historia











