• Saltar al contenido principal
  • Skip to secondary menu
  • Saltar a la barra lateral principal
  • Saltar al pie de página
  • Inicio
  • Secciones
    • Ciencia de datos
    • Criptografía
    • Herramientas
    • Machine Learning
    • Noticias
    • Opinión
    • Productividad
    • Programación
      • JavaScript
      • Julia
      • Matlab
      • Python
      • R
  • Programación
    • JavaScript
    • Julia
    • Matlab
    • Python
    • R
  • Laboratorio
    • Estadística
      • Calculadora del Tamaño Muestral en Encuestas
      • Calculadora de estadísticos descriptivos
      • Test de normalidad
      • Calculadora de contrastes de hipotesis
      • Calculadora de tamano del efecto
      • Simulador de Regresión Lineal con Ruido
      • Visualizador de PCA
      • Visualizador de Series Temporales
      • Simulador de Regresión Logística
      • Simulador de K-Means
      • Simulador de DBSCAN
      • Detector de la Ley de Benford
      • Ajuste de Curvas
      • Calculadora de Matrices
    • Probabilidad
      • Calculadora de Probabilidad de Distribuciones
      • Calculadora de Probabilidades de Lotería
      • Simulador del Problema de Monty Hall
      • Simulador de la Estrategia Martingala
    • Finanzas
      • Calculadora de Préstamos e Hipotecas
      • Conversor TIN ↔ TAE
      • Calculadora DCA con ajuste por inflación
      • Calculadora XIRR con Flujos Irregulares
      • Simulador FIRE (Financial Independence, Retire Early)
    • Negocios
      • CLV
      • Scoring
    • Herramientas
      • Formateador / Minificador de JSON
      • Conversor CSV ↔ JSON
      • Comparador y Formateador de Texto y JSON
      • Formateador y Tester de Expresiones Regulares
      • Inspector de JWT
      • Generador y verificador de hashes
      • Codificador / Decodificador Base64 y URL
      • Conversor de bases numericas
      • Conversor de Timestamp Unix
      • Conversor de colores
      • Generador de UUIDs
    • Juegos
      • Tres en Raya
      • Nim con Q-Learning
    • Más
      • Método D’Hondt
      • Generador de Contraseñas Seguras
  • Noticias
  • Boletín
  • Contacto
  • Tienda
    • Libros
    • Equipamiento de oficina
    • Equipamiento en movilidad

Analytics Lane

Ciencia e ingeniería de datos aplicada

  • Ciencia de datos
  • Machine Learning
  • IA Generativa
  • Python
  • Pandas
  • NumPy
  • R
  • Excel

¿Es sostenible la ciencia de datos basada en Software Libre?

febrero 18, 2022 Por Daniel Rodríguez Deja un comentario
Tiempo de lectura: 4 minutos

A finales del año pasado saltaba la noticia de la existencia de una vulnerabilidad crítica en Apache Log4j, afectando a millones de aplicaciones y servicios que usaban esta librería para la creación de los logs. Poniendo en jaque a miles de pequeñas, medianas y grandes empresas. La gravedad del fallo de seguridad se puede ver en el hecho de que la noticia ha llegado a las portadas de los medios de comunicación generalistas, no solo los tecnológicos. Lo que no es habitual y solamente se puede ver cuándo se producen importantes ataques a grandes empresas o instituciones públicas. Algo que se descubrió con la vulnerabilidad es que Apache Log4j, a pesar de ser una pieza clave para miles de empresas, el mantenimiento lo llevaban únicamente tres voluntarios en su tiempo libre. Lo que también sucede en miles de proyectos usados a diario por miles de científicos de datos. Algo que nos puede llevar a plantear: ¿puede ser sostenible la ciencia de datos basada en Software Libre?

Las ventajas del Software Libre

En los últimos años se ha visto que el Software Libre es una excelente opción a la hora de lanzar proyectos tecnológicos. Aunque para muchos responsables de proyectos lo más llamativo de este tipo de software es el coste de adquisición de licencias, generalmente no tiene coste, sus ventajas van mucho más allá. A diferencia de las soluciones basadas en software propietario, donde generalmente no es posible acceder al código fuente, en el caso del software libre es posible revisar el código fuente e introducir modificaciones. Aunque esto no se hace en la mayoría de los casos, es una garantía cuando se desea auditar los programas en búsqueda de errores y puertas traseras. Habitualmente el software se usa como un componente sin revisar el mismo.

La caverna del consumo, o cómo Greenspan miraba calzoncillos para hacer política monetaria – El bestiario de los indicadores económicos absurdos (parte 1)
En Analytics Lane
La caverna del consumo, o cómo Greenspan miraba calzoncillos para hacer política monetaria – El bestiario de los indicadores económicos absurdos (parte 1)

Estas ventajas, especialmente la barrera de entrada que tiene el precio de las soluciones comerciales ha facilitado el uso de este tipo de software. Sin olvidar que en muchos casos la calidad puede ser incluso mejor que la del software propietario. En el caso de los científicos de datos, una gran mayoría del trabajo se realiza en la actualidad con Python, R o Julia. Ampliando las funcionalidades de las plataformas con los paquetes que se pueden encontrar en repositorios públicos como PyPI, CRAN y Registro General de Julia respectivamente.

Desventajas del Software Libre

Quizás la principal desventaja del software libre es la falta de soporte. Algo que no se ve en los grandes proyectos como pueden ser Linux, Python, R o Julia, pero sí que afecta a muchas librerías claves en el día a día.

En este punto me gustaría que pensasen en cuáles son los paquetes que usas en tu día a día. Luego que pienses en las dependencias de esos paquetes, aquellos que son necesarios instalar para que estos puedan funcionar. ¿Cuántos de estos están mantenidos por una persona en su tiempo libre? O peor, ¿cuántos de estos están abandonados por sus desarrolladores? Paquetes que pueden dejar de funcionar tras una actualización de Python, R o Julia. Aunque para mantener los sistemas en producción existe la solución de no actualizar sus componentes. Esto puede ser un problema mayor si existen fallos de seguridad que pueden ser fácilmente atacados, como fue el caso de Apache Log4j. Aunque no es habitual en el caso de los proyectos que hacemos los científicos de datos, es algo posible.

Publicidad


El problema es la falta de incentivos y algunos usuarios

Realmente para publicar un paquete en un repositorio público no suele existir más incentivo que la satisfacción personal. A lo mejor satisfacer el ego. Pero no existe ningún otro incentivo.

Por otro lado, al publicar el paquete aparecen las consultas de soporte. Algo que, en el caso de que el proyecto se vuelva popular, puede llegar a ser abrumador. Especialmente si solo lo mantiene una persona. Pudiendo llegar a recibir consultas en las que el usuario exige respuestas urgentes como si existiese un servicio de atención al cliente 24/365. Algo que puede llevar al abandono de los proyectos por parte de sus desarrolladores.

Así no podemos preguntar si se puede basar la ciencia de datos basada en Software Libre

Personalmente pienso que sí. Es posible seguir realizando proyectos de ciencia de datos basada en Software Libre, así como en otras áreas, trabajando con Software Libre. Aunque debemos ser conscientes que muchos de estos proyectos están mantenidos únicamente por voluntarios.

Además de esto, si el software es de utilidad para nosotros y el proyecto lo admite no está de más hacer un donativo para su mantenimiento. Haciendo los donativos especialmente con aquellos proyectos pequeños que sean de utilidad para nosotros, ya que estos no suelen tener el soporte detrás de una empresa o una fundación.

Imagen de Free Photos en Pixabay

¿Te ha parecido de utilidad el contenido?

¡Puntúalo entre una y cinco estrellas!

Puntuación promedio 0 / 5. Votos emitidos: 0

Ya que has encontrado útil este contenido...

¡Síguenos en redes sociales!

¡Siento que este contenido no te haya sido útil!

¡Déjame mejorar este contenido!

Dime, ¿cómo puedo mejorar este contenido?

Publicaciones relacionadas

  • La caverna del consumo, o cómo Greenspan miraba calzoncillos para hacer política monetaria – El bestiario de los indicadores económicos absurdos (parte 1)
  • La vanidad del paisaje, o por qué un becario sale a contar grúas a Manhattan – El bestiario de los indicadores económicos absurdos (parte 2)
  • Analytics Lane lanza la versión 1.1 del laboratorio con nuevas suites de CLV y Scoring
  • El Binning en Credit Scoring: El Arte de Discretizar Variables
  • Cómo comparar tendencias con gráficos de líneas en Matplotlib: guía práctica paso a paso
  • Analytics Lane lanza la versión 1.2 del laboratorio con nuevas herramientas de ajuste de curvas y cálculo matricial
  • Subplots en Matplotlib: cómo organizar múltiples gráficos en una sola figura
  • Ley de Benford: cómo detectar datos manipulados con ejemplos reales
  • Síndrome del objeto brillante en ciencia de datos: el error simétrico a los costes hundidos

Publicado en: Ciencia de datos, Opinión

Interacciones con los lectores

Deja una respuesta Cancelar la respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

I accept the Terms and Conditions and the Privacy Policy

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Barra lateral principal

Suscríbete a nuestro boletín

Suscríbete al boletín semanal para estar al día de todas las publicaciones.

Política de Privacidad

Analytics Lane en redes sociales

  • Amazon
  • Bluesky
  • Facebook
  • GitHub
  • Instagram
  • Mastodon
  • Pinterest
  • RSS
  • Telegram
  • Tumblr
  • Twitter
  • YouTube

Publicidad

Entradas recientes

El Binning en Credit Scoring: El Arte de Discretizar Variables

junio 16, 2026 Por Daniel Rodríguez

Noticias

Analytics Lane lanza la versión 1.2 del laboratorio con nuevas herramientas de ajuste de curvas y cálculo matricial

junio 12, 2026 Por Daniel Rodríguez

La vanidad del paisaje, o por qué un becario sale a contar grúas a Manhattan – El bestiario de los indicadores económicos absurdos (parte 2)

junio 11, 2026 Por Daniel Rodríguez

Publicidad

Es tendencia

  • Solución a ‘IndentationError: unexpected indent’ en Python paso a paso publicado el marzo 24, 2025 | en Python
  • Acelerar el código Python con Numba publicado el febrero 8, 2021 | en Python
  • Cómo extender el tamaño de un disco en Rocky Linux 9 usando growpart y LVM publicado el septiembre 2, 2025 | en Herramientas
  • La tabla de la web finalmente importada en Excel Importar tablas desde la web en Excel publicado el octubre 21, 2020 | en Herramientas
  • Regresión de Vectores de Soporte (SVR, Support Vector Regression) publicado el diciembre 17, 2021 | en Ciencia de datos

Publicidad

Lo mejor valorado

4.9 (24)

Seleccionar filas y columnas en Pandas con iloc y loc

4.6 (16)

Archivos JSON con Python: lectura y escritura

4.4 (14)

Ordenación de diccionarios en Python mediante clave o valor

4.7 (13)

Operaciones de filtrado de DataFrame con Pandas en base a los valores de las columnas

4.1 (11)

Aplicar el método D’Hondt en Excel

Comentarios recientes

  • bif en JSON en bases de datos: cuándo es buena idea y cuándo no
  • bif en Cómo desinstalar Oracle Database 19c en Windows
  • M. Pilar en Cómo eliminar las noticias en Windows 11 y recuperar tu concentración
  • Daniel Rodríguez en Probabilidad básica: cómo entender el azar en nuestra vida diaria
  • Pepe en Probabilidad básica: cómo entender el azar en nuestra vida diaria

Publicidad


Footer

Analytics Lane

  • Acerca de Analytics Lane
  • Boletín de noticias
  • Contacto
  • Libros
  • Lo más popular
  • Noticias
  • Tienda
  • Tiendas afiliadas

Secciones

  • Ciencia de datos
  • Criptografía
  • Herramientas
  • Machine Learning
  • Opinión
  • Productividad
  • Programación
  • Reseñas

Sobre de Analytics Lane

En Analytics Lane tratamos de explicar los principales conceptos de la ciencia e ingeniería de datos con un enfoque práctico. Los principales temas tratados son ciencia de datos, ingeniería de datos, inteligencia artificial, machine learning, deep learning y criptografía. Además, también se habla de los principales lenguajes de programación y herramientas utilizadas por los científicos e ingenieros de datos.

Copyright © 2018-2026 Analytics Lane ·Términos y condiciones ·Política de Cookies ·Política de Privacidad ·Herramientas de privacidad ·Contacto