Noticias

Publicación de nuevos conjuntos de datos de Microsoft Research

Microsoft Research acaba de publicar un nuevo conjunto de datos abiertos y los ha puesto a disposición para su descarga en Microsoft Research Open Data.

Los conjuntos de datos de Microsoft Research se encuentran categorizados por área de investigación, entre las que se encuentran: física, ciencias sociales, ciencias ambientales y ciencias de la información. La mayoría de los conjuntos de datos publicados no se encontraban disponibles públicamente previamente. Estos conjuntos de datos son útiles para la investigación en técnicas de inteligencia artificial y aprendizaje automático.

Entre los conjuntos de datos publicados se puede encontrar:

  • 38 millones de tweets relacionados con las elecciones estadounidenses de 2012
  • Datos de captura 3-D de personas que realizan diferentes gestos con las manos
  • Infer.NET, un framework para inferencia bayesiana en modelos gráficos
  • Un millón de imágenes de celebridades etiquetas
  • MS MARCO, es un nuevo conjunto de datos a gran escala para comprensión de lectura y preguntas y respuestas
  • Un corpus de 2,7 millones de palabras provenientes de búsquedas de Bing.

La mayoría de los conjuntos de datos se encuentran en archivos de texto sin formato, por lo que son adecuados para trabajar con cualquier herramienta de análisis de datos.

Imágenes: Pixabay

¿Te ha parecido de utilidad el contenido?

Daniel Rodríguez

Share
Published by
Daniel Rodríguez

Recent Posts

WOE e IV: La Base Matemática del Credit Scoring

Cuando un banco evalúa una solicitud de crédito necesita responder a una pregunta aparentemente simple:…

2 días ago

Lanzamiento de la versión 1.0 del laboratorio de Analytics Lane con nuevas herramientas de scoring

En el octavo aniversario de Analytics Lane seguimos ampliando nuestro laboratorio de aplicaciones interactivas y,…

4 días ago

¡Analytics Lane cumple ocho años!

Hoy, 2 de mayo de 2026, Analytics Lane cumple exactamente ocho años. Todo empezó con…

5 días ago

Analytics Lane lanza una Calculadora de Rentabilidad con Flujos Irregulares basada en TIR (XIRR)

La nueva herramienta permite calcular la rentabilidad real de inversiones con múltiples aportaciones, retiradas y…

5 días ago

Analytics Lane lanza un Conversor CSV ↔ JSON para transformar datos en tiempo real

Analytics Lane continúa ampliando su laboratorio de utilidades para desarrolladores y analistas de datos con…

6 días ago

Analytics Lane lanza un nuevo Formateador y Tester de Expresiones Regulares para desarrolladores

Analytics Lane continúa ampliando su laboratorio de herramientas para desarrolladores con el lanzamiento del Formateador…

6 días ago

This website uses cookies.