• Saltar al contenido principal
  • Skip to secondary menu
  • Saltar a la barra lateral principal
  • Saltar al pie de página
  • Inicio
  • Secciones
    • Ciencia de datos
    • Criptografía
    • Herramientas
    • Machine Learning
    • Noticias
    • Opinión
    • Productividad
    • Programación
      • JavaScript
      • Julia
      • Matlab
      • Python
      • R
  • Programación
    • JavaScript
    • Julia
    • Matlab
    • Python
    • R
  • Noticias
  • Boletín
  • Contacto
  • Tienda
    • Libros
    • Equipamiento de oficina
    • Equipamiento en movilidad
    • Tiendas afiliadas
      • AliExpress
      • Amazon
      • Banggood
      • GeekBuying
      • Lenovo

Analytics Lane

Ciencia e ingeniería de datos aplicada

  • Ciencia de datos
  • Machine Learning
  • Python
  • Pandas
  • NumPy
  • Matlab
  • Julia
  • JavaScript
  • Excel

Caché de funciones en R

mayo 9, 2018 Por Daniel Rodríguez Deja un comentario
Tiempo de lectura: 3 minutos

Reloj de arena

En algunas ocasiones puede ser que en la implementación de un algoritmo se llame continuamente a la misma función utilizando los mismos parámetros. Algo que se puede de forma habitual en problemas recesivos. En caso de que la función se ejecute rápidamente no será un problema mayor, pero en las ocasiones que no es así aparecen problemas de rendimiento. Para solucionar estos problemas se pueden almacenar los resultados en una tabla y, antes de ejecutar la función, comprobar si la tarea se ha realizado previamente. En R esto se puede realizar automáticamente con el paquete memoise. En el que se encuentra la función memoise con la que se puede generar copias que cachea cualquier función.

Función de ejemplo

Supongamos que tenemos una función que tarda un segundo en obtener un resultado:

slow <- function(x) {
  Sys.sleep(1)
  x + 1
}

En caso se que se ejecute esta función 10 veces el tiempo en finalizar será próximo a unos 10 segundos. Esto se puede comprobar simplemente utilizando el siguiente código:

system.time(for (i in 1:10) print(slow(i)))

Ahora, utilizando el paquete memoise se puede crear una versión cachead de la función:

Publicidad


library(memoise)

slow.cache <- memoise(slow)

Igual que antes el tiempo de ejecución de la función será de unos 10, pero la segunda vez que se ejecute el código será prácticamente instantáneo. Esto se puede comprobar ejecutando dos veces la siguiente línea.

system.time(for (i in 1:10) print(slow.cache(i)))

En el caso de que sea necesario borrar los resultados ya almacenados de una función cachada simplemente se ha de utilizar la función forget del mismo paquete:

forget(slow.cache)

Este paquete permite mejorar el rendimiento de algunos de nuestros algoritmos de una forma fácil sin la necesidad de modificar mucho código.

Ejemplo en un problema real

El ejemplo anterior muestra la potencia de la función memoise, pero no es habitual encontrase con problemas como este. Las situaciones en la que este paquete se hace realmente útil es en los problemas recursivos como puede ser la obtención de Sucesión de Fibonacci. Los números de Fibonacci quedan definidos por la ecuación:

Publicidad


f(n) <- f(n-1) + f(n-2)

partiendo de dos primeros valores predeterminados:

f(1) = 1
f(2) = 2

La implementación de esta función en R se puede realizar con

fibonacci <- function(n) {
  if (n < 2) {
     return(n)
  } else {
    return(fibonacci (n-1) + fibonacci (n-2))
  }
}

Se puede comprobar el tiempo que tarda en obtener los primeros 40 número de la serie:

system.time(f_original <- fibonacci_cache(40))

En mi ordenador ha tardado unos 120,237 segundos. Ahora se puede comprobar el tiempo el tiempo que tardaría en la función cacheada:

fibonacci <- memoise(fibonacci)
system.time(f_cache_1 <- fibonacci (40))

La salida de la función memoise se ha asignado a la variable con el mismo nombre que la original. En caso de que esto no se haga así no se obtendrá una mejora de los resultados debido a que internamente se llamará a una función no cachada.

Publicidad


En esta ocasión R solamente ha tardado unos 0,019 segundos. Los que supone solamente un del 0,016% del tiempo original.

En caso de que se repita el ejercicio, en este caso el tiempo ser cero.

system.time(f_cache_2 <- fibonacci (40))

Obviamente los resultados en las tres ocasiones son el mismo: 102334155.

¿Te ha parecido de utilidad el contenido?

¡Puntúalo entre una y cinco estrellas!

Puntuación promedio 0 / 5. Votos emitidos: 0

Publicidad


Ya que has encontrado útil este contenido...

¡Síguenos en redes sociales!

¡Siento que este contenido no te haya sido útil!

¡Déjame mejorar este contenido!

Dime, ¿cómo puedo mejorar este contenido?

Publicaciones relacionadas

  • electricity
    Introducción al paquete dplyr del Tidyverse
  • feather-ga
    Lectura y escritura de archivos Apache Arrow o Feather en R
  • luggage
    Documentación de los paquetes (Creación de paquetes…
  • desk-tidy
    Introducción al Tidyverse
  • luggage
    Validación y distribución de los paquetes R…
  • Escaleras
    Barras de progreso en R y alarma de finalización

Publicado en: R

Interacciones con los lectores

Deja una respuesta Cancelar la respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

I accept the Terms and Conditions and the Privacy Policy

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Publicidad





Barra lateral principal

Suscríbete a nuestro boletín

Suscríbete al boletín semanal para estar al día de todas las publicaciones.

Política de Privacidad

Analytics Lane en redes sociales

  • Amazon
  • Facebook
  • GitHub
  • Instagram
  • Pinterest
  • RSS
  • Twitter
  • Tumblr
  • YouTube

Publicidad

Entradas recientes

Mantener un sistema de alta disponibilidad con PostgreSQL y repmgr

diciembre 1, 2023 Por Daniel Rodríguez

Diferencias entre los errores 401 y 403 del estándar HTTP

noviembre 29, 2023 Por Daniel Rodríguez

Ver el código de cualquier función en Python

noviembre 27, 2023 Por Daniel Rodríguez

Publicidad

Es tendencia

  • El método Sainte-Laguë y su implementación en Python publicado el septiembre 22, 2023 | en Ciencia de datos
  • Operaciones de filtrado de DataFrame con Pandas en base a los valores de las columnas publicado el mayo 10, 2019 | en Python
  • NumPy NumPy: Crear matrices vacías en NumPy y adjuntar filas o columnas publicado el enero 11, 2021 | en Python
  • ¿Cómo cambiar el nombre de las columnas en Pandas? publicado el mayo 6, 2019 | en Python
  • Ordenación de diccionarios en Python mediante clave o valor publicado el enero 14, 2019 | en Python

Publicidad

Lo mejor valorado

4.9 (22)

Seleccionar filas y columnas en Pandas con iloc y loc

4.7 (12)

Operaciones de filtrado de DataFrame con Pandas en base a los valores de las columnas

4.6 (15)

Archivos JSON con Python: lectura y escritura

4.5 (10)

Diferencias entre var y let en JavaScript

4.4 (13)

Ordenación de diccionarios en Python mediante clave o valor

Publicidad

Comentarios recientes

  • Anto en Rendimiento al iterar en JavaScript sobre un vector
  • Daniel Rodríguez en Creación de un certificado Let’s Encrypt en Windows con Win-Acme
  • Guillermo en Creación de un certificado Let’s Encrypt en Windows con Win-Acme
  • Daniel Rodríguez en ¿Cómo eliminar columnas y filas en un dataframe pandas?
  • Miguel en ¿Cómo eliminar columnas y filas en un dataframe pandas?

Publicidad

Footer

Analytics Lane

  • Acerca de Analytics Lane
  • Boletín de noticias
  • Contacto
  • Libros
  • Lo más popular
  • Noticias
  • Tienda
  • Tiendas afiliadas

Secciones

  • Ciencia de datos
  • Criptografía
  • Herramientas
  • Machine Learning
  • Opinión
  • Productividad
  • Programación
  • Reseñas

Sobre de Analytics Lane

En Analytics Lane tratamos de explicar los principales conceptos de la ciencia e ingeniería de datos con un enfoque práctico. Los principales temas tratados son ciencia de datos, ingeniería de datos, inteligencia artificial, machine learning, deep learning y criptografía. Además, también se habla de los principales lenguajes de programación y herramientas utilizadas por los científicos e ingenieros de datos.

Copyright © 2018-2023 Analytics Lane ·Términos y condiciones ·Política de Cookies ·Política de Privacidad ·Herramientas de privacidad ·Contacto