• Saltar al contenido principal
  • Skip to secondary menu
  • Saltar a la barra lateral principal
  • Saltar al pie de página
  • Inicio
  • Secciones
    • Ciencia de datos
    • Criptografía
    • Herramientas
    • Machine Learning
    • Noticias
    • Opinión
    • Productividad
    • Programación
      • JavaScript
      • Julia
      • Matlab
      • Python
      • R
  • Programación
    • JavaScript
    • Julia
    • Matlab
    • Python
    • R
  • Laboratorio
    • Estadística
      • Calculadora del Tamaño Muestral en Encuestas
      • Calculadora de estadísticos descriptivos
      • Test de normalidad
      • Calculadora de contrastes de hipotesis
      • Calculadora de tamano del efecto
      • Simulador de Regresión Lineal con Ruido
      • Visualizador de PCA
      • Visualizador de Series Temporales
      • Simulador de Regresión Logística
      • Simulador de K-Means
      • Simulador de DBSCAN
      • Detector de la Ley de Benford
      • Ajuste de Curvas
      • Calculadora de Matrices
    • Probabilidad
      • Calculadora de Probabilidad de Distribuciones
      • Calculadora de Probabilidades de Lotería
      • Simulador del Problema de Monty Hall
      • Simulador de la Estrategia Martingala
    • Finanzas
      • Calculadora de Préstamos e Hipotecas
      • Conversor TIN ↔ TAE
      • Calculadora DCA con ajuste por inflación
      • Calculadora XIRR con Flujos Irregulares
      • Simulador FIRE (Financial Independence, Retire Early)
    • Negocios
      • CLV
      • Scoring
    • Herramientas
      • Formateador / Minificador de JSON
      • Conversor CSV ↔ JSON
      • Comparador y Formateador de Texto y JSON
      • Formateador y Tester de Expresiones Regulares
      • Inspector de JWT
      • Generador y verificador de hashes
      • Codificador / Decodificador Base64 y URL
      • Conversor de bases numericas
      • Conversor de Timestamp Unix
      • Conversor de colores
      • Generador de UUIDs
    • Juegos
      • Tres en Raya
      • Nim con Q-Learning
    • Más
      • Método D’Hondt
      • Generador de Contraseñas Seguras
  • Noticias
  • Boletín
  • Contacto
  • Tienda
    • Libros
    • Equipamiento de oficina
    • Equipamiento en movilidad

Analytics Lane

Ciencia e ingeniería de datos aplicada

  • Ciencia de datos
  • Machine Learning
  • IA Generativa
  • Python
  • Pandas
  • NumPy
  • R
  • Excel

Representar los criterios de selección en árboles de decisión

Machine learning, Scikit-Learn

junio 3, 2022 Por Daniel Rodríguez Deja un comentario
Tiempo de lectura: 3 minutos

La representación de árboles de decisión es un tema del que ya se ha publicado con antelación en el blog. En su momento de ha visto los pasos necesarios para generar representaciones gráficas y de texto con las librerías PyDotPlus y Scikit-Learn. Aunque también existen otras librerías como dtreeviz, la que veremos hoy. Una librería con la que es posible representar los criterios de selección en árboles de decisión de una forma clara, por lo que puede ser una excelente opción para la representación de estos modelos.

Instalación de dtreeviz

La instalación de dtreeviz es un poco más complicada que otros paquetes de Python, porque depende de Graphviz, un conjunto de herramientas para la creación de diagramas que debe ser instalado por separado en el ordenador. Así que en primer lugar es necesario comprobar si tenemos instalado o no este conjunto de herramientas en nuestro ordenador, algo que se puede hacer simplemente escribiendo dot -v en la terminal. En el caso de que esté instalado y en el path nos aparecerá por pantalla la versión instalada, en caso contrario no indicará que el comando no existe.

Si Graphviz no se encuentra instalado, deberemos ir a la zona de descargas del proyecto y seguir las instrucciones para nuestro sistema operativo. Una vez instalado Graphviz, podremos instalar dtreeviz desde PyPI usando para ello el comando

La caverna del consumo, o cómo Greenspan miraba calzoncillos para hacer política monetaria – El bestiario de los indicadores económicos absurdos (parte 1)
En Analytics Lane
La caverna del consumo, o cómo Greenspan miraba calzoncillos para hacer política monetaria – El bestiario de los indicadores económicos absurdos (parte 1)

pip install dtreeviz

Por lo que ya podremos usar este paquete para la representación de árboles de decisión.

Representar un árbol de decisión con dtreeviz

Para ver dtreeviz en funcionamiento se puede usar el mismo ejemplo empleado para explicar las capacidades gráficas de Scikit-Learn respecto a los árboles de decisión. Un árbol basado en los datos de Iris que se puede crear y representar con el siguiente código.

Con lo que Scikit-Learn generará la siguiente gráfica.

Representación gráfica del árbol de decisión
Representación gráfica del árbol de decisión

Ahora, una vez creado el árbol, se pueden ver los pasos para crear la representación del árbol con dtreeviz. Para lo que primero hay que importar la función dtreeviz. Esta función requiere el árbol, los datos de entrenamiento y, opcionalmente, se le puede pasar también el nombre de las características y las clases para incluirlas en la gráfica. Creando la función un objeto que se puede llamar para visualizar, tal como se muestra a continuación.

En esta gráfica se puede ver un histograma de las clases para la característica empleada por el árbol de decisión para clasificar. Mostrando la posición del punto de corte en la gráfica. Además, en los nodos finales del árbol se ve una gráfica de tarta con la proporción de las clases. Una forma de representar los árboles que puede ser bastante útil a la hora de explicar cómo se toman las decisiones.

Representación gráfica del árbol de decisión con dtreeviz.
Representación gráfica del árbol de decisión con dtreeviz.

La gráfica que se obtiene es un SVG, el cual se puede exportar a un archivo mediante el método save(). Esto genera un archivo CSV que posteriormente se puede convertir en otro formato. Así, para guardar la imagen en un archivo se debería escribir algo como lo siguiente.

viz.save("dtreeviz-iris.svg")

Publicidad


Conclusiones

En esta ocasión se ha visto una herramienta para representar los criterios de selección en árboles de decisión de una forma gráfica. Facilitando así explicar el motivo por el qué los modelos seleccionan una clase u otra en cada momento. Una forma de representar estos modelos que se agrega a las ya vista con PyDotPlus y Scikit-Learn.

Imagen de jplenio en Pixabay

¿Te ha parecido de utilidad el contenido?

¡Puntúalo entre una y cinco estrellas!

Puntuación promedio 0 / 5. Votos emitidos: 0

Ya que has encontrado útil este contenido...

¡Síguenos en redes sociales!

¡Siento que este contenido no te haya sido útil!

¡Déjame mejorar este contenido!

Dime, ¿cómo puedo mejorar este contenido?

Publicaciones relacionadas

  • La caverna del consumo, o cómo Greenspan miraba calzoncillos para hacer política monetaria – El bestiario de los indicadores económicos absurdos (parte 1)
  • La vanidad del paisaje, o por qué un becario sale a contar grúas a Manhattan – El bestiario de los indicadores económicos absurdos (parte 2)
  • Augurios deportivos y portadas malditas, o cuando The Economist predice mejor al revés – El bestiario de los indicadores económicos absurdos (parte 3)
  • El bestiario de los indicadores económicos absurdos: El zoo patrio
  • El Binning en Credit Scoring: El Arte de Discretizar Variables
  • Las fórmulas con DNI, o cómo dividir cualquier cosa entre cualquier otra cosa puede acabar publicado en un titular serio – El bestiario de los indicadores económicos absurdos (parte 5)
  • Cómo comparar tendencias con gráficos de líneas en Matplotlib: guía práctica paso a paso
  • Analytics Lane lanza la versión 1.2 del laboratorio con nuevas herramientas de ajuste de curvas y cálculo matricial
  • Analytics Lane lanza la versión 1.3 del laboratorio con nuevas herramientas de evaluación de modelos y utilidades prácticas

Publicado en: Ciencia de datos, Python Etiquetado como: Machine learning, Scikit-Learn

Interacciones con los lectores

Deja una respuesta Cancelar la respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

I accept the Terms and Conditions and the Privacy Policy

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Barra lateral principal

Suscríbete a nuestro boletín

Suscríbete al boletín semanal para estar al día de todas las publicaciones.

Política de Privacidad

Analytics Lane en redes sociales

  • Amazon
  • Bluesky
  • Facebook
  • GitHub
  • Instagram
  • Mastodon
  • Pinterest
  • RSS
  • Telegram
  • Tumblr
  • Twitter
  • YouTube

Publicidad

Entradas recientes

Las fórmulas con DNI, o cómo dividir cualquier cosa entre cualquier otra cosa puede acabar publicado en un titular serio – El bestiario de los indicadores económicos absurdos (parte 5)

julio 2, 2026 Por Daniel Rodríguez

Analytics Lane lanza ScoreFlow, un SaaS para construir y desplegar scorecards de crédito

julio 1, 2026 Por Daniel Rodríguez

DBSCAN y la selección de ε: teoría, intuición y aplicación práctica

junio 30, 2026 Por Daniel Rodríguez

Publicidad

Es tendencia

  • Buscar en Excel con dos o más criterios publicado el septiembre 7, 2022 | en Herramientas
  • Números calientes en Bonoloto: mismos resultados que el azar publicado el octubre 9, 2020 | en Opinión
  • Curiosidad: El origen del análisis exploratorio de datos y el papel de John Tukey publicado el septiembre 4, 2025 | en Ciencia de datos, Opinión
  • Error de VirtualBox: Kernel Driver Not Installed (rc=-1908) Solucionar problema de VirtualBox: Kernel Driver Not Installed (rc=-1908) publicado el octubre 21, 2022 | en Herramientas
  • El método de Muller e implementación en Python publicado el marzo 24, 2023 | en Ciencia de datos

Publicidad

Lo mejor valorado

4.9 (24)

Seleccionar filas y columnas en Pandas con iloc y loc

4.6 (16)

Archivos JSON con Python: lectura y escritura

4.4 (14)

Ordenación de diccionarios en Python mediante clave o valor

4.7 (13)

Operaciones de filtrado de DataFrame con Pandas en base a los valores de las columnas

4.1 (11)

Aplicar el método D’Hondt en Excel

Comentarios recientes

  • bif en JSON en bases de datos: cuándo es buena idea y cuándo no
  • bif en Cómo desinstalar Oracle Database 19c en Windows
  • M. Pilar en Cómo eliminar las noticias en Windows 11 y recuperar tu concentración
  • Daniel Rodríguez en Probabilidad básica: cómo entender el azar en nuestra vida diaria
  • Pepe en Probabilidad básica: cómo entender el azar en nuestra vida diaria

Publicidad


Footer

Analytics Lane

  • Acerca de Analytics Lane
  • Boletín de noticias
  • Contacto
  • Libros
  • Lo más popular
  • Noticias
  • Tienda
  • Tiendas afiliadas

Secciones

  • Ciencia de datos
  • Criptografía
  • Herramientas
  • Machine Learning
  • Opinión
  • Productividad
  • Programación
  • Reseñas

Sobre de Analytics Lane

En Analytics Lane tratamos de explicar los principales conceptos de la ciencia e ingeniería de datos con un enfoque práctico. Los principales temas tratados son ciencia de datos, ingeniería de datos, inteligencia artificial, machine learning, deep learning y criptografía. Además, también se habla de los principales lenguajes de programación y herramientas utilizadas por los científicos e ingenieros de datos.

Copyright © 2018-2026 Analytics Lane ·Términos y condiciones ·Política de Cookies ·Política de Privacidad ·Herramientas de privacidad ·Contacto