Una vez finalizada la escritura de nuestro paquete, incluida la escritura de las pruebas automáticas, la documentación y las viñetas es necesario distribuirlo. En el caso de que los paquetes sean públicos y cumplan las normas del CRAN es posible enviarlo a para su aprobación. Aunque este no es el único camino para distribuir el trabajo. Ya que se pueden distribuir como archivos … [Leer más...] acerca de Validación y distribución de los paquetes R (Creación de paquetes en R 8ª y última parte)
Aprendizaje automático para la detección del fraude en seguros
La industria de seguros es un sector muy atractivo para el crimen especializado en fraude. Debido a que, al igual que el caso de banca, las empresas aseguradoras gestionan grandes cantidades de dinero y datos confidenciales de sus asegurados. En este sector, los clientes siempre pueden simular siniestros para acceder al pago de los seguros, lo que puede llevar a grandes … [Leer más...] acerca de Aprendizaje automático para la detección del fraude en seguros
Concatenar cadenas de texto en Python de forma óptima
La concatenación de cadenas de texto es una tarea habitual. Por eso en Python, al igual que otros lenguajes de programación, esta se puede realizar simplemente con el operador adicción +. Pero también existe un método de las cadenas de texto para esta tarea join. El cual permite concatenar cadenas de texto en Python de una forma más rápida y óptima para nuestros … [Leer más...] acerca de Concatenar cadenas de texto en Python de forma óptima
Incluir tutoriales: creación de viñetas (Creación de paquetes en R 7ª parte)
La semana pasada hemos visto cómo crear la documentación de nuestros paquetes de R mediante el uso de roxygen2. Documentación que es imprescindible a la hora de trabajar con cualquier librería. Pero, en la mayoría de los casos lo que realmente buscan los usuarios a la hora de empezar a usar un paquete nuevo es un tutorial con ejemplos en los que se enseñan algunos usos … [Leer más...] acerca de Incluir tutoriales: creación de viñetas (Creación de paquetes en R 7ª parte)
Aprendizaje automático para la detección del fraude en comercio electrónico
El comercio electrónico es un área en el que el fraude es cada vez más habitual. Tanto los clientes como los ciberdelincuentes pueden intentar obtener de forma fraudulenta los bienes o servicios comercializados. Afortunadamente este es un sector en el que los datos son abundantes y, por lo tanto, es posible utilizar sistemas de aprendizaje automático para la detección del … [Leer más...] acerca de Aprendizaje automático para la detección del fraude en comercio electrónico
Importar archivos XML en Python
XML (Extensible Mark up Language) es un lenguaje de marcado que codifica los datos en texto plano. Permitiendo así que estos puedan ser legibles tanto por parte de máquinas como por personas, de manera análoga a los JSON. Actualmente es un lenguaje que es usado por múltiples programas para almacenar y transmitir datos estructurados. A diferencia de los archivos JSON o Excel no … [Leer más...] acerca de Importar archivos XML en Python
Documentación de los paquetes (Creación de paquetes en R 6ª parte)
La documentación de los paquetes es una tarea clave, ya que es la forma de explicar a los usuarios cómo utilizar las funciones y cual es la respuesta que se puede esperar. En un paquete de R la documentación de las funciones se incluye en los archivos Rd que se encuentra dentro de la carpeta man. Siendo esta la información que verán los usuarios cuando consulten la ayuda de las … [Leer más...] acerca de Documentación de los paquetes (Creación de paquetes en R 6ª parte)
Aprendizaje automático para la detección del fraude en banca
Una de las áreas más atractivas para los criminales es el sector bancario, debido a que gestiona grandes cantidades de dinero y datos privados de los clientes. La disponibilidad de datos permite que el aprendizaje automático sea una herramienta clave para la detección del fraude en banca. Ayudando a evitar pérdidas financieras y de reputación tanto para las entidades … [Leer más...] acerca de Aprendizaje automático para la detección del fraude en banca
Vectorización en Python para mejorar el rendimiento
Python es uno de los leguajes de programación más populares en la actualidad en ciencia de datos y otras áreas intensivas en cálculo numérico. Aun así, no es rápido en comparación con otros lenguajes. Por eso, conocer las prácticas que nos permiten obtener el mejor rendimiento en nuestros códigos es importante. Para poder reducir así el tiempo de ejecución de nuestros … [Leer más...] acerca de Vectorización en Python para mejorar el rendimiento
Medir la cobertura de las pruebas automáticas (Creación de paquetes en R 5ª parte)
Un dato importante a la hora de trabajar con pruebas automáticas es saber que parte del código está cubierto y qué parte no. Ya que las parte que no esté cubierto por pruebas automáticas es más probable que aparezcan fallos durante las tareas de mantenimiento, o que tenga errores porque nunca se hubiese probado esa parte. Para esto en R también tenemos herramientas con las que … [Leer más...] acerca de Medir la cobertura de las pruebas automáticas (Creación de paquetes en R 5ª parte)
Prueba de independencia de Chi-cuadrado con Excel
En una entrada reciente se explicó los fundamentos de la prueba de independencia de Chi-cuadrado, una prueba que se puede encontrar fácilmente en R o Python. Pero en Excel es necesario implementarla. Hoy se explicará cómo se puede implementar la prueba de independencia de Chi-cuadrado con Excel.Planteamiento del problemaUn grupo de investigadores desean comprobar si … [Leer más...] acerca de Prueba de independencia de Chi-cuadrado con Excel
Importar tablas desde webs con Pandas
En muchas páginas web es habitual encontrase con datos en formato de tablas. Datos que pueden ser de interés en nuestros estudios, por lo que disponer de una función que permita importarlos de forma fácil y sencilla es algo que nos puede ahorrar mucho tiempo. Por eso en Pandas existe el método read_html() con el que se pueden importar tablas desde webs.Tablas en páginas … [Leer más...] acerca de Importar tablas desde webs con Pandas