Microsoft crea Group Transcribe para desgrabar conversaciones y convertirlas a texto en tiempo real


Microsoft creó la nueva aplicación experimental Group Transcribe, que utiliza varios dispositivos para proporcionar transcripciones y traducciones de voz en tiempo real, y que solicita la ayuda de los usuarios para hacer la inteligencia artificial (IA) más inclusiva.

Group Transcribe está dirigido a las personas que actualmente tienen que tomar notas en las reuniones, especialmente durante el trabajo, ya que es difícil realizar esta tarea y al mismo tiempo participar en las reuniones, pero también a las personas con discapacidad auditiva.

Según informó la compañía en un comunicado, la nueva app ya se encuentra disponible para móviles iOS en todo el mundo y constituye una “nueva forma de mejorar la inteligencia artificial del habla y el lenguaje”.

A medida que se terminen las pruebas, será liberado para Android y también, para usuarios de PC, dispondrá una página web de fácil acceso.

El software está disponible únicamente para teléfonos iPhone. David Paul Morris/Bloomberg

La aplicación utiliza sesiones compartidas y emplea los micrófonos de los móviles de todos los participantes para mejorar la calidad de la transcripción y también para poder determinar qué personas ha dicho cada cosa en todo momento.

Group Transcribe está disponible en más de 80 idiomas, incluido el español, y puede utilizarse también para funciones inclusivas, como conversar en diferentes idiomas utilizando las transcripciones o ayudar a las personas con problemas de audición.

Las funciones de la aplicación se completan con las posibilidad de comenzar conversaciones, invitar a otras personas, revisar transcripciones anteriores y compartir de forma sencilla con otras personas. El teléfono tiene que estar colocado siempre a una corta distancia del usuario, suficiente como para agarrarlo con la mano.

Microsoft ha defendido la importancia de la participación de los usuarios con “datos altamente relevantes” para el desarrollo de modelos de IA, y ha asegurado que sus investigaciones “no aprovechan ni un minuto de este audio (grabado por Group Transcribe)”, como ha defendido Pavan Li, responsable del proyecto de la app, para destacar su privacidad.

Desgrabado automático

El paquete de programas Microsoft Office ofrece también la posibilidad de traducción en simultáneo.

El paquete de programas Microsoft Office ofrece también la posibilidad de traducción en simultáneo.

Unos meses atrás, Microsoft incorporó soporte para transcripción en la versión web de Word, lo que permite pasar a texto las grabaciones de audio tanto en tiempo real como de archivos subidos a la plataforma. Una función siempre codiciada por quienes tienen que pasar entrevistas grabadas a un documento escrito.

La idea es que nuevas funciones del paquete de Office incorporen esta característica, como es el caso de PowerPoint o OneNote.

La función de transcripción convierte la voz en texto directamente en Word o desde un archivo de audio. Es capaz de identificar distintos hablantes, por ejemplo, en una conferencia o una entrevista, y permite editar los textos para hacer correcciones.

La transcripción se encuentra dentro del botón de Dictado, en la barra de tareas. El usuario no verá el texto a medida que se reproduce la voz -como ocurre con el dictado- cuando la captura en tiempo real, sino que al finalizar la función mostrará la transcripción completa. En el caso de los archivos de audio que se carguen, la compañía restringe el uso a un máximo de cinco horas al mes.

El soporte para la transcripción está disponible desde este martes en la versión web de Word, como informan desde The Verge, y requiere una suscripción a Microsoft 365. Por el momento, solo soporta el inglés, aunque la compañía planea ampliarlo a otros idiomas y plataformas más adelante.

SL



Fuente