Tecnologia
PUBLICIDADE
Por — São Paulo

A OpenAI anunciou nesta segunda-feira que irá abrir para todos os usuários a sua versão mais poderosa até aqui do ChatGPT, alimentada pelo GPT-4o, novo modelo de inteligência artificial (IA) da empresa. A atualização permite que o robô processe imagem, texto e voz em tempo real e de forma mais eficiente. O objetivo é criar uma interação humano-computador "muito mais natural", segundo a companhia.

— Uma parte importante da nossa missão é poder disponibilizar nossas ferramentas avançadas de IA para todos gratuitamente. — afirmou Mira Murati, diretora de tecnologia da OpenAI, durante o "Spring Update", evento que apresentou o GPT-4o.

Murati acrescentou que o novo modelo é "muito mais rápido" do que a vesão anterior, o GPT-4, além de ter capacidade maior de processar texto, imagem e áudio.

De acordo com a executiva, os assinantes do serviço vão poder processar "cinco vezes" mais conteúdos na versão paga. Na versão gratuita, haverá um limite de mensagens que poderão ser trocadas com o GPT-4o. "Quando o limite for atingido, o ChatGPT mudará automaticamente para GPT-3.5 (uma versão anterior)", explica a empresa.

ChatGPT sugere que funcionário da OpenAI arrume o cabelo para participar de entrevista — Foto: Reprodução/OpenAI
ChatGPT sugere que funcionário da OpenAI arrume o cabelo para participar de entrevista — Foto: Reprodução/OpenAI

Depois do evento em que apresentou o GPT-4o, a OpenAI divulgou uma série de demonstrações das novas funções do sistema. Em vídeos curtos, funcionários da companhia contam piadas para o ChatGPT (que responde com risada), pedem para a ferramenta cantar "parabéns" a um aniversariante e escutam conselhos do robô sobre como melhorar o visual para participar de uma entrevista.

— O GPT-4o é o nosso melhor modelo de todos os tempos. É inteligente, é rápido e é nativamente multimodal— escreveu o CEO da OpenAI, Sam Altman, nas redes sociais.

Essa é a primeira vez que um modelo de inteligência artificial da OpenAI já nasce multimodal (com treinamento de texto, áudio e visão juntos). A voz do GPT-4o também foi aprimorada - é menos robótica que as versões anteriores. Com esse salto, a empresa de Altman leva para o ChatGPT características de assistentes pessoais - como a Alexa, da Amazon, e a Siri, da Apple -, mas com mais funcionalidades.

Outra novidade apresentada nesta segunda-feira é a chegada do aplicativo do ChatGPT para computador. Isso significa que, além de acessar o robô pela web ou pelo celular, será possível ter o ChatGPT instalado no PC.

O app será ativado com um comando simples que abrirá uma janela do GPT-4o no computador. O usuário poderá compartilhar a tela com a ferramenta e fazer perguntas, ou enviar informações e conversar com o sistema. A versão para macOS estará disponível a partir desta segunda-feira e a versão Windows será lançada até o fim do ano, segundo a OpenAI.

Os novos recursos de texto e imagem do GPT-4o já estão disponíveis no ChatGPT. As interações com voz serão lançadas "em breve", de acordo com a companhia.

Traduções e conversas em tempo real

Com o GPT-4o, a ferramenta irá funcionar com capacidades de fala que envolvem interações em tempo real. Na demonstração dos novos recursos, um executivo da OpenAI pediu conselhos para o ChatGPT para se acalmar em uma apresentação importante. O assistente de voz foi capaz de ouvir e analisar a respiração dele, depois oferecer sugestões sobre como seria possível melhorar:

— Uau, diminua um pouco o ritmo, Mark, você não é um aspirador de pó — brincou uma voz feminina do ChatGPT reformulado.

Executivos da OpenAI conversam em línguas diferentes com tradução em tempo real do ChatGPT — Foto: Reprodução/OpenAI
Executivos da OpenAI conversam em línguas diferentes com tradução em tempo real do ChatGPT — Foto: Reprodução/OpenAI

Antes do GPT-4o, os usuários já podiam enviar mensagens de voz para o ChatGPT. O robô, no entanto, demorava até 5,4 segundos para responder. Com a atualização, a ideia é que os usuários possam ter uma conversa fluida com a ferramenta. As respostas vão demorar, em média, 320 milissegundos para serem dadas, o que é "semelhante ao tempo de resposta humano em uma conversa", explica a empresa.

Uma das funcionalidades do sistema será a de realizar traduções e intermediar conversas em diferentes línguas. Durante o evento que apresentou o "novo" ChatGPT, Mira Murati falou em italiano com Mark Chen, um dos chefes de pesquisa da OpenAI:

— Tenho uma amiga aqui que só fala italiano e eu só falo inglês. Toda vez que você ouvir inglês, quero que traduza para o italiano e se você ouvir italiano, quero que traduza de volta para o inglês — pediu Mark ao ChatGPT, que funcionou como um intérprete na conversa entre os dois.

Além de multimodal, a OpenAI afirma que o GPT-4o é também multilíngue, com desempenho aprimorado em cerca de 50 idiomas.

ChatGPT vai ler emoções

Em outra demonstração, a equipe da OpenAI exibiu como ChatGPT agora será capaz de "enxergar" a partir da câmera do celular. Uma equação simples foi exibida e a IA foi capaz de dar conselhos de como resolvê-la.

O sistema também poderá interpretar emoções a partir de imagens. Durante o "Spring Update", Barret Zoph, diretor de Pós-Treinamento da OpenAI, abriu a câmera, sorriu para o ChatGPT e perguntou "que tipo de emoções" ele estava sentindo. Em um primeiro momento, o sistema o confundiu com uma "superfície de madeira", que tinha sido apresentada minuto antes. Depois, o robô se corrigiu:

Barret Zoph, da OpenAI, pede que ChatGPT  analise suas emoções — Foto: Reprodução/OpenAI
Barret Zoph, da OpenAI, pede que ChatGPT analise suas emoções — Foto: Reprodução/OpenAI

— Parece que você está se sentindo muito feliz e alegre, com um grande sorriso e talvez até um toque de entusiasmo. — respondeu a inteligência artificial. — O que quer que esteja acontecendo, parece que você está de ótimo humor.

A atualização também vai permitir que todos os usuários enviem imagens para o ChatGPT e peçam que ele analise o conteúdo, de documentos e tabelas a fotografias ou capturas de tela. Antes, apenas assinantes da ferramenta tinham essa possibilidade. "Por exemplo, agora você pode tirar uma foto de um menu em um idioma diferente e falar com o GPT-4o para traduzi-lo, aprender sobre a história e o significado da comida, e obter recomendações", conforme a OpenAI.

Outra possibilidade é de usar a capacidade de "visão" da IA para descrever objetos ou cenas de forma simultânea. Em uma das demonstrações da OpenAI, um usuário anda pela rua com o celular na mão e conversa com o ChatGPT, pedindo detalhes das cenas.

'Parece a IA dos filmes'

No futuro, a empresa pretende ir além com a capacidade de visão e voz do ChatGPT. "Por exemplo, você poderá mostrar ao ChatGPT um jogo de esportes ao vivo e pedir que ele lhe explique as regras", projeta a companhia.

"Parece a IA dos filmes. E ainda é um pouco surpreendente para mim que seja real", escreveu Altman em uma publicação feita em seu blog pessoal. Nas redes sociais, o executivo citou a refência cinematográfica do GPT-4o: o filme "Her", de 2013, em que um homem solitário se apaixona por um sistema operacional de inteligência artificial avançado.

"Ter o tempo de resposta em níveis humanos e expressividade é uma grande mudança", acrescentou o CEO da OpenAI. "É rápido, inteligente, divertido, natural e útil".

O anúncio da OpenAI acontece às vésperas do principal evento anual do Google, o Google I/O, que começa nesta terça-feira, em Mountain View, California. A rival liderada por Sundar Pichai deve apresentar novos recursos de inteligência artificial (IA) com o Gemini, concorrente do ChatGPT. Na semana que vem, a corrida de novidades de IA terá a largada ainda da Microsoft, que fará anúncios na área durante o Build 2024.

Mais recente Próxima Batalha global dos chips ganha fôlego com aumento de subsídios de US$ 81 bilhões
Mais do Globo

Quartas de final do torneio disputado na Alemanha começa na próxima sexta (5), às 13h (de Brasília)

Quartas de final da Eurocopa 2024: quem transmite, horários, tabela e onde assistir aos jogos

Ao GLOBO, a petista disse que vai notificar judicialmente Zambelli pela fala durante a Reunião de Mulheres Parlamentares do P20, que ocorre em Maceió

'Ela terá a correção necessária', diz Benedita da Silva após Carla Zambelli a chamar de 'Chica da Silva'

Atividades, disponíveis na Tijuca, no Maracanã e no Méier, vão de esportes à culinária

Projetos sociais na Zona Norte oferecem cursos gratuitos para crianças e adultos, incluindo pessoas com deficiência

Líder da subsidiária brasileira da WTW, uma das maiores seguradoras globais e que emitiu a apólice do Titanic, diz que empresas ainda não estão preparadas para as mudanças climáticas

‘O Brasil também é um país sujeito a catástrofes’, diz executivo de seguradora mapeia 'riscos emergentes'

Ataques foram feitos através de um perfil anônimo e organizado por homens presos após a aplicação da Lei Maria da Penha

Ex-secretária e profissionais da Secretaria da Mulher registram queixa após ameaças nas redes sociais

Se antes escolas preparatórias se concentravam em candidatos a concursos públicos, agora o mercado se expande e já foca em estudantes que desejam participar de seleções para grandes empresas

Cursinhos preparam candidatos a trainee nas empresas em lógica parecida com a dos concurseiros

O tema será contas públicas. O ponto a evitar é mais gasolina no fogo da crise do câmbio


Reunião da tarde entre Lula e ministros da área econômica será decisiva

Influenciadora terminou recentemente namoro discreto com Marco Túlio após um ano e meio

Fãs notam detalhe curioso em cliques de Gkay e especulam: 'Vejo sinais do ex no fundo das fotos'

A conversa é uma prévia sobre os assuntos fiscais que serão detalhados à tarde com a equipe econômica

Haddad está no Alvorada em reunião não prevista

Foram US$ 7,9 bilhões em retiradas líquidas entre janeiro e junho, pior resultado desde os US$ 16 bilhões do período da pandemia, mostra levantamento da Bloomberg

Bolsa brasileira tem maior saída de estrangeiros num 1º semestre desde 2020, no auge da Covid