El análisis de redes es una herramienta gracias a la cual se puede estudiar las relaciones y estructuras existentes en diversos ámbitos, desde redes sociales hasta sistemas biológicos y urbanos. Una de las medidas más básicas en el análisis de redes es la centralidad de grado, que mide cuántas conexiones directas tiene un nodo dentro de un grafo. Su simplicidad la convierte en … [Leer más...] acerca de Introducción a igraph en R (Parte 2): Grado de los nodos y su centralidad en grafos
R
R nació como una implementación libre del S, un lenguaje de programación muy utilizado por la comunidad estadística. Actualmente es el lenguaje de programación más popular para el análisis estadístico. Gozando de una gran popularidad en campos como la minería de datos, la bioinformática y finanzas. Una gran parte de su popularidad es debido a que se puede extender fácilmente gracias a los más de 15.000 paquetes disponibles hoy en día en el CRAN. Por lo que casi siempre se puede encontrar un paquete que implementa el algoritmo necesario en cada momento
Introducción a igraph en R: Análisis de Redes desde Cero
El análisis de redes es una disciplina fundamental en muchas áreas del conocimiento, desde la sociología y la biología hasta la informática y la economía. La capacidad de representar y analizar relaciones entre entidades permite obtener información clave sobre las estructuras de los sistemas y comprender los comportamientos que se observan en diferentes sistemas. En este … [Leer más...] acerca de Introducción a igraph en R: Análisis de Redes desde Cero
Auditar el código R con lintr
Seguir unos estándares de calidad a la hora de escribir un programa es algo clave de cara al futuro mantenimiento de cualquier solución. Haciendo más fácil su lectura al homogeneizar el estilo. Algo que también aplica en R. Una solución para garantizar el seguimiento de estos estándares son los analizadores estáticos de código o Linter. En R existe el paquete lintr con el que … [Leer más...] acerca de Auditar el código R con lintr
Otener la cotización del Bitcoin con R
Para consultar la cotización del Bitcoin, o de cualquier otra criptomoneda, se puede usar una de las múltiples API que existen en la actualidad. La plataforma de intercambio de criptomonedas Bitmex ofrece posiblemente una de las API más sencillas de utilizar. Además de no ser necesario disponer de una clave privada para poder consultar las cotizaciones como puede suceder en … [Leer más...] acerca de Otener la cotización del Bitcoin con R
Detección de anomalías en series temporales
La detección de anomalías es un campo del aprendizaje automático con múltiples aplicaciones prácticas. Poder identificar automáticamente los datos que son atípicos para una variable permite lanzar alarmas para comprobar la existencia temprana de algún problema. Pudiendo actuar en consecuencia y minimizar las posibles consecuencias. Recientemente he descubierto un paquete de R, … [Leer más...] acerca de Detección de anomalías en series temporales
Diferencias entre Apache Arrow y Parquet
Apache Arrow y Parquet son dos formatos modernos para con los que es posible conseguir archivos más pequeños que CSV, además de unos menores tiempos de lectura y escritura. Veamos a continuación las diferencias que existen entre Apache Arrow y Parquet.Apache ArrowApache Arrow es una biblioteca, disponible para múltiples lenguajes de programación, que proporciona … [Leer más...] acerca de Diferencias entre Apache Arrow y Parquet
Lectura y escritura de archivos Apache Arrow o Feather en R
En entradas recientes hemos hablado de las ventajas que ofrecen los archivos Apache Arrow o Feather frente a los tradicionales CSV. No solo ocupan menos espacio en disco, sino que los procesos de lectura y escritura son varios órdenes de magnitud más rápidos. Siendo ambas son grandes ventajas cuando se trabaja con conjunto de datos de gran tamaño. La única desventaja podría ser … [Leer más...] acerca de Lectura y escritura de archivos Apache Arrow o Feather en R
Cómo combinar dataframes en R
Suele ser habitual que los conjuntos de datos con los que trabajamos no se encuentren en una única tabla. Por ejemplo, los datos que identifican al cliente y las operaciones que este ha realizado. Una forma puede ser unirlos en una base de datos mediante un comando SQL. Aunque también se pueden combinar dataframes en R directamente, usando para ello la función … [Leer más...] acerca de Cómo combinar dataframes en R
Cómo ordenar dataframe en base a múltiples columnas en R
Una tarea bastante habitual cuando se trabaja con conjuntos de datos es ordenar los registros en base los valores de una o varias columnas. Por ejemplo, buscar los clientes con mayor número de visitas y, a igual número de visitas, ordenarlos por gasto. Lo que se pude conseguir fácilmente en R. Únicamente hay que combinar el uso de order() con with() para poder ordenar dataframe … [Leer más...] acerca de Cómo ordenar dataframe en base a múltiples columnas en R
Obtener la media móvil en R
La media móvil es una herramienta que se utiliza habitualmente en análisis de series temporales para eliminar las fluctuaciones a corto plazo. Lo que facilita la observación de las tendencias a largo plazo de la serie. Existen diferentes métodos para calcular la media móvil, siendo el más empleado es media móvil simple (Moving Average), en la que se utilizan la media aritmética … [Leer más...] acerca de Obtener la media móvil en R
Diferencias entre library() y require() en R
En R existen dos funciones con las que se puede cargar los paquetes que tenemos instalados en nuestras sesiones: library() y require(). Aunque ambas funciones parece que hacen lo mismo: adjuntan los espacios de nombres de los nuevos paquetes sin recargar los ya cargados. Existen algunas diferencias entre library() y require() que son importante conocer, para utilizar así la más … [Leer más...] acerca de Diferencias entre library() y require() en R
Introducción al paquete dplyr del Tidyverse
Uno de los paquetes que más me gustan del R Tidyverse es dplyr. Un paquete del que no recuerdo cuántos años llevo utilizando para procesar los conjuntos de datos en R. En esta entrada vamos a ver algunas operaciones básicas que se pueden realizar con las funciones de este paquete, para lo que utilizaremos la sintaxis que nos ofrece el operador de tubería (pipe) que vimos la … [Leer más...] acerca de Introducción al paquete dplyr del Tidyverse