Actualmente está creciendo la popularidad de las interfaces habladas debido a la popularidad entre otros de los asistentes de voz. Aunque existe un problema importante: obtener una salida de voz que suene natural es aún muy complicado. Siendo necesario un entrenamiento muy costoso. Microsoft acaba de anunciar que ha desarrollado una forma más eficaz. Creando una inteligencia artificial que puede traducir texto a voz a con solamente 200 muestras de sonido, lo que es alrededor de 20 minutos. Para lo que se utilizan modelos basados en redes neuronales profundas.
Los sonidos obtenidos aún muestras un ligero sonido robótico, pero son muy precisos con una inteligibilidad de las palabras. Provocando que las soluciones de texto a voz sean más accesibles y populares en un futuro próximo. Ofreciendo así a pequeñas empresas y aficionados la probabilidad de crear voces artificiales realistas.
eñas empresas y aficionados la probabilidad de crear voces artificiales realistas.
Imágenes: Pixabay (Michael Gaida)
En ciencia de datos y estadística, los promedios y porcentajes son herramientas fundamentales para resumir…
Las bases de datos son el corazón de casi cualquier sistema de información moderno. Ya…
En ciencia de datos, pocas cosas llaman más la atención de los científicos de datos…
Calcular adecuadamente el tamaño de la muestra es una parte esencial en el diseño de…
Hoy en día, cuando pensamos en ciencia de datos, lo primero que nos viene a…
Ampliar el espacio de almacenamiento en un sistema Linux es una tarea habitual y crítica…
This website uses cookies.