OpenAI da a ChatGPT aptitud de hablar vía cinco voces diferentes
Agencias, Ciudad de México.- La startup de inteligencia artificial OpenAI va a implementar una función para su aplicación ChatGPT que le permite al chatbot responder a preguntas y comandos hablados con su propia voz.
A partir de las próximas dos semanas, los usuarios podrán elegir una voz en la aplicación del chatbot, entre cinco personajes con nombres como “Juniper”, “Breeze” y “Ember”. ChatGPT luego producirá un audio del texto que genera en esa voz; por ejemplo, leyendo en voz alta un cuento antes de dormir generado por IA. La función estará disponible para las personas que se suscriban al servicio ChatGPT Plus de OpenAI por US$20 al mes y para usuarios empresariales.
OpenAI lanzó su aplicación ChatGPT en mayo y ya ofrece una capacidad de voz a texto que permite a los usuarios hablar con el bot. Agregar una función de respuesta en audio podría crear la sensación de que las personas están en una conversación más humana. La compañía espera que la nueva función fomente el uso de su aplicación móvil sobre la marcha, poniéndola en competencia más estrecha con ofertas de asistentes personales como el asistente de Google, Siri de Apple Inc. o Alexa de Amazon.com Inc.
Entre las solicitudes, se le puede pedir al programa que hable sobre la historia de Disneyland mientras conduce hacia el parque temático, o pedirle la receta de un cóctel mientras busca ingredientes en la cocina. Durante una prueba de la herramienta, narró hábilmente una historia sobre una estrella de mar y un colinabo. Sin embargo, aunque ChatGPT puede componer letras de canciones, la aplicación se negará a cantar.
Las voces de ChatGPT suenan bastante humanas (aunque al escuchar muy atentamente se nota un tono un poco robótico). OpenAI dijo que trabajó con actores de voz para construir el modelo de inteligencia artificial de texto a voz que subyace a la función.
Por su parte, los que usan la versión gratuita de esta herramienta podrán sacarle partido a estas nuevas actualizaciones “poco después”, según OpenAI.
“La voz y la imagen te brindan más formas de usar ChatGPT en tu vida. Cuando estés en casa, saca fotografías de tu refrigerador y despensa para saber qué hay para cenar (y haz preguntas para obtener una receta paso a paso)”, anota la empresa en un comunicado.
Mientras que para ejemplificar cómo se puede usar la herramienta de voz, la empresa dice que se puede utilizar para “contar un cuento o resolver un debate”.
Por ahora, este asistente de voz -que es similar a Alexa, de Amazon, y a Siri, de Apple,- estará disponible para iOS y Android, pero no en PC.
Se podrán elegir entre cinco voces distintas, aunque la voz que viene por defecto y la que salía en los ejemplos de hoy es una voz que imita a la de una mujer joven y aparentemente blanca, como suele ser habitual en este tipo de herramientas.
Mediante Whisper -herramienta de OpenAI que usa la IA para trascribir audio- se convierte la voz del usuario a texto, y la compañía luego usa su nuevo modelo de conversión de texto a voz para la respuesta de la máquina.
“Nuestra nueva tecnología de voz es capaz de crear voces sintéticas realistas a partir de tan solo unos segundos de voz real. Esto abre las puertas a muchas aplicaciones creativas y da herramientas de accesibilidad. Sin embargo, estas capacidades también presentan nuevos riesgos, como la posibilidad de que actores maliciosos se hagan pasar por figuras públicas o cometan fraude”, advierte la empresa.
OpenAI, además, anunció hoy que la plataforma de música Spotify está utilizando el “poder de esta tecnología para traducir algunos de sus pódcast a “idiomas adicionales, pero manteniendo las propias voces de los presentadores e invitados”.
La compañía también dijo que en las próximas semanas los usuarios que pagan y los empresariales podrán acceder a una función de GPT-4 —uno de los modelos de IA que impulsa ChatGPT— en la que se puede presentar una imagen y una pregunta relacionada al respecto. Por ejemplo, será posible subir una imagen de gafas de sol rosadas y pedirle al chatbot que sugiera un atuendo que combine con ellas, o enviar una imagen de un problema matemático y solicitarle ayuda para resolverlo. La función, que OpenAI anunció anteriormente este año cuando presentó GPT-4, está disponible a través de la aplicación y el sitio web de ChatGPT.
Los derechos de inclusión, el gran tema de las elecciones del 2021: IEPC
Parlamento Juvenil 2019, espacio para el análisis y participación democrática
Candidato del PRI al Gobierno de Zacatecas y su esposa ocultan compra de residencias en Miami