La semana pasada hemos visto cómo crear la documentación de nuestros paquetes de R mediante el uso de roxygen2. Documentación que es imprescindible a la hora de trabajar con cualquier librería. Pero, en la mayoría de los casos lo que realmente buscan los usuarios a la hora de empezar a usar un paquete nuevo es un tutorial con ejemplos en los que se enseñan algunos usos … [Leer más...] acerca de Incluir tutoriales: creación de viñetas (Creación de paquetes en R 7ª parte)
Aprendizaje automático para la detección del fraude en comercio electrónico
El comercio electrónico es un área en el que el fraude es cada vez más habitual. Tanto los clientes como los ciberdelincuentes pueden intentar obtener de forma fraudulenta los bienes o servicios comercializados. Afortunadamente este es un sector en el que los datos son abundantes y, por lo tanto, es posible utilizar sistemas de aprendizaje automático para la detección del … [Leer más...] acerca de Aprendizaje automático para la detección del fraude en comercio electrónico
Importar archivos XML en Python
XML (Extensible Mark up Language) es un lenguaje de marcado que codifica los datos en texto plano. Permitiendo así que estos puedan ser legibles tanto por parte de máquinas como por personas, de manera análoga a los JSON. Actualmente es un lenguaje que es usado por múltiples programas para almacenar y transmitir datos estructurados. A diferencia de los archivos JSON o Excel no … [Leer más...] acerca de Importar archivos XML en Python
Documentación de los paquetes (Creación de paquetes en R 6ª parte)
La documentación de los paquetes es una tarea clave, ya que es la forma de explicar a los usuarios cómo utilizar las funciones y cual es la respuesta que se puede esperar. En un paquete de R la documentación de las funciones se incluye en los archivos Rd que se encuentra dentro de la carpeta man. Siendo esta la información que verán los usuarios cuando consulten la ayuda de las … [Leer más...] acerca de Documentación de los paquetes (Creación de paquetes en R 6ª parte)
Aprendizaje automático para la detección del fraude en banca
Una de las áreas más atractivas para los criminales es el sector bancario, debido a que gestiona grandes cantidades de dinero y datos privados de los clientes. La disponibilidad de datos permite que el aprendizaje automático sea una herramienta clave para la detección del fraude en banca. Ayudando a evitar pérdidas financieras y de reputación tanto para las entidades … [Leer más...] acerca de Aprendizaje automático para la detección del fraude en banca
Vectorización en Python para mejorar el rendimiento
Python es uno de los leguajes de programación más populares en la actualidad en ciencia de datos y otras áreas intensivas en cálculo numérico. Aun así, no es rápido en comparación con otros lenguajes. Por eso, conocer las prácticas que nos permiten obtener el mejor rendimiento en nuestros códigos es importante. Para poder reducir así el tiempo de ejecución de nuestros … [Leer más...] acerca de Vectorización en Python para mejorar el rendimiento
Medir la cobertura de las pruebas automáticas (Creación de paquetes en R 5ª parte)
Un dato importante a la hora de trabajar con pruebas automáticas es saber que parte del código está cubierto y qué parte no. Ya que las parte que no esté cubierto por pruebas automáticas es más probable que aparezcan fallos durante las tareas de mantenimiento, o que tenga errores porque nunca se hubiese probado esa parte. Para esto en R también tenemos herramientas con las que … [Leer más...] acerca de Medir la cobertura de las pruebas automáticas (Creación de paquetes en R 5ª parte)
Prueba de independencia de Chi-cuadrado con Excel
En una entrada reciente se explicó los fundamentos de la prueba de independencia de Chi-cuadrado, una prueba que se puede encontrar fácilmente en R o Python. Pero en Excel es necesario implementarla. Hoy se explicará cómo se puede implementar la prueba de independencia de Chi-cuadrado con Excel.Planteamiento del problemaUn grupo de investigadores desean comprobar si … [Leer más...] acerca de Prueba de independencia de Chi-cuadrado con Excel
Importar tablas desde webs con Pandas
En muchas páginas web es habitual encontrase con datos en formato de tablas. Datos que pueden ser de interés en nuestros estudios, por lo que disponer de una función que permita importarlos de forma fácil y sencilla es algo que nos puede ahorrar mucho tiempo. Por eso en Pandas existe el método read_html() con el que se pueden importar tablas desde webs.Tablas en páginas … [Leer más...] acerca de Importar tablas desde webs con Pandas
Pruebas avanzadas con testthat (Creación de paquetes en R 4ª parte)
La semana pasada se ha visto una pequeña introducción a la creación de pruebas automáticas en un paquete de R. Esta semana vamos a ver unos conceptos para crear pruebas avanzadas con testthat cómo son las funciones setup y teardown. En esta entrada no hablaremos de mocks ya que es un tema del que hemos hablado anteriormente en el blog. Si necesitamos probar servicios externos … [Leer más...] acerca de Pruebas avanzadas con testthat (Creación de paquetes en R 4ª parte)
Prueba exacta de Fisher
La semana pasada hemos vistos la prueba de independencia de Chi-cuadrado, con la que se puede comprobar la independencia de dos variables cuantitativas. En dicha entrada se comentó que cuando la frecuencia de alguna de las categorías de las variables es pequeña no es aconsejable emplear esta prueba, sino que se debería usar la prueba exacta de Fisher. La cual vamos a explicar … [Leer más...] acerca de Prueba exacta de Fisher
Convertir archivos CSV a XLSX con Python
Los archivos de Excel y CSV son los formatos más utilizados para el intercambio de datos tabulados. En algunas situaciones puede ser necesario convertir los archivos de un formato a otro, cuando los usuarios que reciben los datos lo quieren en un formato concreto o cuando el programa no admite más que uno de tipos de archivo. En esta entrada vamos a ver se pueden convertir … [Leer más...] acerca de Convertir archivos CSV a XLSX con Python








