Noticias

Publicación de nuevos conjuntos de datos de Microsoft Research

Microsoft Research acaba de publicar un nuevo conjunto de datos abiertos y los ha puesto a disposición para su descarga en Microsoft Research Open Data.

Los conjuntos de datos de Microsoft Research se encuentran categorizados por área de investigación, entre las que se encuentran: física, ciencias sociales, ciencias ambientales y ciencias de la información. La mayoría de los conjuntos de datos publicados no se encontraban disponibles públicamente previamente. Estos conjuntos de datos son útiles para la investigación en técnicas de inteligencia artificial y aprendizaje automático.

Entre los conjuntos de datos publicados se puede encontrar:

  • 38 millones de tweets relacionados con las elecciones estadounidenses de 2012
  • Datos de captura 3-D de personas que realizan diferentes gestos con las manos
  • Infer.NET, un framework para inferencia bayesiana en modelos gráficos
  • Un millón de imágenes de celebridades etiquetas
  • MS MARCO, es un nuevo conjunto de datos a gran escala para comprensión de lectura y preguntas y respuestas
  • Un corpus de 2,7 millones de palabras provenientes de búsquedas de Bing.

La mayoría de los conjuntos de datos se encuentran en archivos de texto sin formato, por lo que son adecuados para trabajar con cualquier herramienta de análisis de datos.

Imágenes: Pixabay

¿Te ha parecido de utilidad el contenido?

Daniel Rodríguez

Share
Published by
Daniel Rodríguez

Recent Posts

Curiosidad: ¿Por qué usamos p < 0.05? Un umbral que cambió la historia de la ciencia

En casi cualquier análisis estadístico —ya sea en medicina, psicología, economía o ciencia de datos—…

3 días ago

¿Está concentrado el MSCI World? Un análisis con Gini, Lorenz y leyes de potencia

El MSCI World Index suele presentarse como “la ventana al mundo” para quienes invierten en…

5 días ago

Curiosidad: La maldición de la dimensionalidad, o por qué añadir más datos puede empeorar tu modelo

En el mundo del análisis de datos solemos escuchar una idea poderosa: cuantos más datos,…

1 semana ago

Error npm ERR! code EACCES al instalar paquetes en Node.js: Cómo solucionarlo paso a paso

¿Te has encontrado con este error al intentar instalar paquetes con npm? npm ERR! code…

2 semanas ago

Curiosidad: La Paradoja de Simpson, o por qué no siempre debes fiarte de los promedios

En ciencia de datos y estadística, los promedios y porcentajes son herramientas fundamentales para resumir…

2 semanas ago

Copias de seguridad automáticas en SQL Server con rotación de archivos

Las bases de datos son el corazón de casi cualquier sistema de información moderno. Ya…

3 semanas ago

This website uses cookies.