Microsoft dota a su IA Copilot de voz, visión, inteligencia emocional y la capacidad de razonar

La compañía quiere que su asistente sea un "compañero" al que los usuarios puedan acudir no solo para pedir ayuda, sino también para conversar.

Bruselas pide a YouTube, Snapchat y Tik Tok más datos sobre sus sistemas de recomendación

Microsoft Copilot
Microsoft Copilot
Sarah Yáñez-Richards (EFE)

02 de octubre 2024 - 21:09

Nueva York/Voz, ojos, inteligencia emocional y capacidad de razonar para ser un "compañero" al que los usuarios puedan acudir no solo para pedir ayuda, sino también para conversar.

Son algunas de las funciones que Microsoft ha anunciado para su asistente de inteligencia artificial generativa, Copilot, en un evento en Nueva York en el que Mustafa Suleyman, director ejecutivo de Microsoft AI, dijo que los ordenadores han aprendido el lenguaje de las personas y que eso "cambia por completo el paradigma interactivo entre ambos".

"Estas máquinas ahora entienden nuestra voz. Pueden transcribir perfectamente lo que hemos dicho. Pueden reaccionar a nuestra entonación. Han llegado a un nivel en el que puedes mantener una conversación fluida, relajada e informal con ellas, que son capaces de captar la inteligencia emocional de tu discurso, por lo que parece que estuvieras teniendo una conversación normal", destacó el cofundador de Google DeepMind.

La nueva voz de Copilot

Según Suleyman, por el momento Copilot Voice, el chatbot en el que el usuario puede conversar con Copilot, no guarda las conversaciones ni la empresa guarda la información para entrenar la IA.

Esta IA tiene cuatro voces y está ya disponible en Australia, Canadá, Nueva Zelanda, Reino Unido y EEUU en las aplicaciones móviles iOS y Android, en la web en copilot.microsoft.com y a través de la aplicación Copilot para Windows.

De acuerdo con Microsoft Copilot Voice estará disponible inicialmente en inglés, pero en una demostración una periodista de EFE consiguió tener conversaciones fluidas con la máquina en francés y español.

Al igual que otras IA, sus respuestas pueden estar bien formadas, pero podrían estarlo con información falsa. Algo que se conoce como alucinaciones, razón por la que el usuario no puede "conversar", con la IA de algunos temas como las elecciones, consultas médicas o advertencias legales.

"Hasta que no tengamos índices de precisión muy altos y tasas de falsos positivos muy bajas, no nos extenderemos a estas otras áreas, pero llegará ese momento. Es cuestión de unos pocos años", adelantó Suleyman.

Los nuevos ojos y capacidad de razonar de Copilot

Los ojos de la IA serán Copilot Vision, chatbot que es capaz de ver el navegador del usuario, entender tanto el texto como las imágenes, y dar consejos o hacer resúmenes sobre lo que ve.

Según Microsoft, esta aplicación puede ser útil para organizar el alojamiento de un viaje en Airbnb -ya que puede escuchar cuáles son las preferencias del usuario y basándose en eso recomendar una opción específica- o elegir una película según las opiniones que los críticos dejan en Rotten Tomatoes -pues puede hacer un resumen de todos los comentarios que hay en la web-.

Esta función no estará disponible en todas las webs de internet y aún está en desarrollo. Por ello, solo se puede acceder a la versión beta, a través de Copilot Labs, en EEUU.

La empresa también presentó Think Deeper -que también solo está disponible en Copilot Labs- en la que la IA se toma más tiempo para razonar su respuesta, lo que, según la empresa, permite responder a una respuesta compleja en la que por ejemplo se cita una lista de pros y contras.

"Lo hemos diseñado para que sea útil para todo tipo de desafíos prácticos y cotidianos, como comparar dos opciones complejas una al lado de la otra. ¿Debería mudarme a esta ciudad o a aquella? ¿Qué tipo de automóvil se adapta mejor a mis necesidades? Y así sucesivamente", explica Microsoft en un comunicado.

Un pódcast personalizado cada mañana

El titán tecnológico también anunció Copilot Daily, un resumen en audio de noticias e información meteorológica que Copilot lee como si fuera un pódcast.

"Trabajamos directamente con Reuters, Financial Times, USA Today... y pagamos por este contenido. Pero con el tiempo, también incluirá correos electrónicos, eventos del calendario y tareas del día. La idea es realmente resumir solo las cosas que necesita saber (el usuario) al amanecer", detalló Suleyman.

stats