Noticias

Publicación de nuevos conjuntos de datos de Microsoft Research

Microsoft Research acaba de publicar un nuevo conjunto de datos abiertos y los ha puesto a disposición para su descarga en Microsoft Research Open Data.

Los conjuntos de datos de Microsoft Research se encuentran categorizados por área de investigación, entre las que se encuentran: física, ciencias sociales, ciencias ambientales y ciencias de la información. La mayoría de los conjuntos de datos publicados no se encontraban disponibles públicamente previamente. Estos conjuntos de datos son útiles para la investigación en técnicas de inteligencia artificial y aprendizaje automático.

Entre los conjuntos de datos publicados se puede encontrar:

  • 38 millones de tweets relacionados con las elecciones estadounidenses de 2012
  • Datos de captura 3-D de personas que realizan diferentes gestos con las manos
  • Infer.NET, un framework para inferencia bayesiana en modelos gráficos
  • Un millón de imágenes de celebridades etiquetas
  • MS MARCO, es un nuevo conjunto de datos a gran escala para comprensión de lectura y preguntas y respuestas
  • Un corpus de 2,7 millones de palabras provenientes de búsquedas de Bing.

La mayoría de los conjuntos de datos se encuentran en archivos de texto sin formato, por lo que son adecuados para trabajar con cualquier herramienta de análisis de datos.

Imágenes: Pixabay

Daniel Rodríguez

Share
Published by
Daniel Rodríguez

Recent Posts

Analytics Lane lanza la versión 1.3 del laboratorio con nuevas herramientas de evaluación de modelos y utilidades prácticas

Seguimos ampliando el laboratorio de Analytics Lane con el lanzamiento de la versión 1.3, disponible…

2 días ago

Augurios deportivos y portadas malditas, o cuando The Economist predice mejor al revés – El bestiario de los indicadores económicos absurdos (parte 3)

Cerramos la serie internacional con la categoría más estrambótica de todas: indicadores que predicen el…

3 días ago

El Binning en Credit Scoring: El Arte de Discretizar Variables

Si el WOE y el IV son la base matemática del credit scoring, el binning…

5 días ago

Analytics Lane lanza la versión 1.2 del laboratorio con nuevas herramientas de ajuste de curvas y cálculo matricial

Seguimos iterando sobre el laboratorio de Analytics Lane y lanzamos la versión 1.2, disponible en:https://www.analyticslane.com/lab/es…

1 semana ago

Cómo comparar tendencias con gráficos de líneas en Matplotlib: guía práctica paso a paso

Tienes los datos de tráfico web de los últimos cinco meses desglosados por canal: orgánico,…

2 semanas ago

This website uses cookies.