ChatGPT acaba de hacer que la IA sea más humana: sus competidores deberían ponerse nerviosos

Ana Altchek
| Traducido por: 
Fotograma de la película 'Her'

Warner Bros. Pictures / Annapurna Pictures

  • OpenAI ha presentado este lunes una actualización de ChatGPT, GPT-4o, que puede razonar a través de audio, imágenes y texto. El nuevo chatbot tiene una capacidad similar a la humana para imitar la dicción, añadiendo humor e inflexión a la voz.
  • Las elevadas capacidades de GPT-4o presionan a sus rivales tecnológicos para que demuestren que pueden ponerse a su altura.

Sam Altman, CEO de OpenAI, bromeó este fin de semana diciendo que las novedades que iba a presentar ChatGPT este lunes parecían "magia"... No se equivocaba.

Básicamente, la compañía de inteligencia artificial ha plantado una bandera en la arena con dos palabras que van dirigidas a sus principales rivales del sector tecnológico: "Os toca".

Mira Murati, CTO de OpenAI, ha sido la encargada de presentar la reciente "Actualización de Primavera" de ChatGPT, un evento en el que se han podido ver una serie de demostraciones en directo. La última versión del chatbot de IA —basada en el nuevo gran modelo lingüístico de OpenAI, GPT-4o— es capaz de razonar en tiempo real con respecto a inputs de audio, imagen y texto.

Y lo hace una forma sorprendentemente parecida a conforme lo haría un ser humano.

Nos estamos acercando peligrosamente a la película Her

Para los que todavía no lo sepan, la voz y las capacidades conversacionales de ChatGPT han dado un gran salto gracias a GPT-4o, que parece capaz de expresar emociones y de variar su tono en función del contexto.

En la demo de OpenAI, la nueva inteligencia artificial parecía la voz de una mujer estadounidense (algo así como Scarlett Johansson en la película Her, de Spike Jonze), aunque los investigadores de la empresa le hicieron cambiar a una voz robótica en un momento dado. Según un portavoz de OpenAI, la salida de audio se limitará a una selección de voces preestablecidas de cara al lanzamiento.

La voz de la IA no solo parecía humana. También mostró una asombrosa capacidad para imitar la dicción humana. El nuevo ChatGPT se ríe, hace bromas y modera su tono de voz en función de las instrucciones que recibe.

Sam Altman

La nueva versión de la herramienta de OpenAI también parece capaz de captar algunos rasgos intrínsecamente humanos. Cuando un investigador estaba hiperventilando mientras ponía en práctica unos ejercicios de respiración profunda, el chatbot le dijo: "Mark, no eres una aspiradora".

Además, ahora puedes interrumpir a ChatGPT, lo que hace que las conversaciones parezcan más naturales, según ha defendido su desarrolladora. No hay que esperar a que la inteligencia artificial termine su respuesta para hacer una repregunta o cambiar de tema.

Durante la demo, el tiempo de respuesta también fue rapidísimo. Según explicó un portavoz de OpenAI, el chatbot puede responder a entradas de audio a una velocidad similar a la de una persona de carne y hueso: 320 milisegundos (de media).

Después de que tuviese lugar el evento de la startup de IA, su CEO, Sam Altman, publicó en X —la red social anteriormente conocida como Twitter— el título de la película que muchos tenían en mente tras las demostraciones.

La vista de ChatGPT también ha mejorado

El chatbot ha demostrado este lunes sus elevadas capacidades para interpretar un gráfico, ayudar con la programación de código fuente, interpretar emociones y, básicamente, enseñar a sus usuarios ecuaciones matemáticas viendo vídeos o imágenes mostradas con la cámara de un simple teléfono móvil.

En todo momento, el asistente de voz mantuvo un tono alegre y desenfadado.

En otra demostración que ha sido publicada en internet, GPT-4o fue capaz incluso de analizar el vídeo del espacio que rodeaba a un usuario, teniendo en cuenta que la persona llevaba una sudadera con capucha de OpenAI y que estaba rodeada de equipos de grabación, para adivinar que podría estar preparando algún anuncio relacionado con su propia desarrolladora.

Aunque el chatbot pareció tener un par de contratiempos durante el evento de OpenAI, como cuando malinterpretó una imagen o empezó a responder de forma imprecisa antes de que la pregunta hubiese finalizado, esos deslices casi han hecho que la herramienta parezca más humana.

Todo parece más natural y avanzado que lo que se ha visto por parte de la competencia

En una ocasión, ChatGPT empezó a responder a una pregunta antes de que el investigador mostrara la ecuación a la cámara y el investigador paró en seco al chatbot.

"Vaya, me he emocionado demasiado", respondió el chatbot. "Estoy listo cuando tú lo estés".

También parecía responder con respuestas que imitaban sentimientos de agradecimiento. Cuando el investigador la mostró al chatbot una imagen de un escrito que decía que amaba a ChatGPT, la herramienta le respondió con un "oh" y le dijo que eso era "muy tierno" por su parte.

En otra ocasión, ChatGPT aseguró que el investigador le estaba haciendo sonrojar cuando este estaba hablando de lo "útil y asombroso" que era el chatbot de inteligencia artificial.

OpenAI ha llevado a cabo estos anuncios apenas un día antes de que tenga lugar la gran conferencia anual para desarrolladores de Google, Google I/O 2024, en la que se espera que la compañía tecnológica revele los avances de sus diversos productos de IA, como su propio chatbot, Gemini.

Es probable que el momento elegido para celebrar el evento de OpenAI, así como sus impresionantes demostraciones, vayan a dejar a los expertos en materia de inteligencia artificial con la intriga de saber si ChatGPT va por delante del chatbot de Google o si la firma de Mountain View se guarda un as bajo la manga.

 

Por ahora, la actualización de primavera de OpenAI demuestra una vez más lo impresionante que puede llegar a ser ChatGPT, sobre todo si se le compara con el resto de asistentes de voz por IA.

Alexa, de Amazon; Siri, de Apple; y Google parecen estar sobre aviso. Sus asistentes de voz son conocidos por ofrecer respuestas robóticas y directas a las preguntas que se les plantean, lejos de ser unas herramientas verdaderamente conversacionales. En ese sentido, el nuevo ChatGPT, impulsado por el modelo GPT-4o, los deja completamente en fuera de juego.

Apple, por su parte, parece ser consciente del abismo que separa a las versiones más antiguas de ChatGPT de Siri. Una información publicada recientemente daba a entender que la tecnológica había tomado la decisión de revisar el asistente de voz del iPhone después de que los ejecutivos de Apple pasasen semanas probando ChatGPT y se diesen cuenta de lo atrasada que estaba su tecnología.

También se ha rumoreado que ambas empresas, Apple y OpenAI, han estado hablando y que el fabricante del iPhone podría acabar licenciando el modelo de inteligencia artificial de ChatGPT para algunas funciones de sus teléfonos móviles (todavía por anunciar).

iPhone, IA

Los fans de Apple no tendrán que esperar mucho para obtener más información. Se espera que la compañía desvele sus actualizaciones en materia de IA el próximo 10 de junio, en la Conferencia Mundial para Desarrolladores (WWDC) que Apple celebra de forma anual.

Mientras tanto, Amazon podría seguir teniendo intención de lanzar una versión de pago de Alexa, "Alexa Plus", que funcionaría con inteligencia artificial generativa. Se supone que el nuevo asistente de voz del gigante del comercio electrónico ofrecería respuestas más conversacionales y personalizadas, pero todavía no se ha revelado la fecha para que se produzca su lanzamiento.

Por el momento, y al igual que hizo con la primera versión de ChatGPT, OpenAI ha vuelto a poner de manifiesto lo impresionante que puede llegar a ser su tecnología y está dejando que el resto de la industria tecnológica demuestre que puede ponerse a su altura.

Conoce cómo trabajamos en Business Insider.