Uma das grandes limitações de grandes sistemas de inteligência artificial hoje é a tendência que eles têm de produzir "alucinações", construindo informação falsa e a repassando como verdadeira. Um grupo de cientistas relatou hoje estar no caminho para resolver esse problema, submetendo a reposta à avaliação por mais dois sistemas de IA.
- Testamos no GLOBO: IA da Meta, que chega em julho ao Brasil, tem erros sobre Lula e estereótipos de gênero
- História recriada: IA inventa e distorce memória do Holocausto, diz Unesco
O problema das respostas falsas dadas a perguntas objetivas é particularmente preocupante em projetos da classe dos LLMs (grandes modelos de linguagem), como o ChatGPT, sujeitos alucinações que cientistas chamam de confabulações. Elas ocorrem quando o sistema busca resposta convincente sem ter tido o material necessário para construí-las incluído em seus dados de treinamento, o volume enorme de informações que tipicamente abastece as LLMs.
As alucinações em grande medida porque é difícil calibrar os modelos para traçar o limite de uma ignorância responsável. Em outras palavras, quando um LLM recebe uma pergunta, mas tem poucas informações sobre o tópico abordado, ele precisa decidir se afirma ao usuário que não tem como fazê-lo ou se tenta respondê-la mesmo assim.
Quando está confabulando, um sistema de IA pode criar uma resposta que não faz sentido, algo que usuários humanos normalmente conseguem identificar. O comportamento mais nocivo, porém, é quando a confabulação produz uma resposta convincente, mas totalmente inventada.
Um quarteto de pesquisadores da Universidade de Oxford, porém, relata hoje em estudo publicado nesta quarta-feira que achou uma solução para minimizar esse comportamento indesejado da inteligência artificial.
- Confusão factual: Uso de IA em notícias gera preocupações em todo o mundo, aponta pesquisa
Liderados pelo cientista da computação Sebastian Farquhar, os cientistas explicam como o fizeram em um artigo na revista Nature.
O jogo dos seis erros da inteligência artificial
![O que foi informado ao sistema: imagem hiper-realista retrata um homem tirando uma selfie com os amigos em um cinema lotado. As pessoas assistem a uma comédia e riem muito — Foto: Imagem gerada por Midjourney](https://cdn.statically.io/img/s2-oglobo.glbimg.com/iMoTPHt3O9ExJUHARME6INKXdCA=/0x0:689x529/648x248/smart/filters:strip_icc()/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/O/g/0AfkXETSefvFzCYpVhBw/106073085-ec-credito-imagem-gerada-por-ia-midjourney-prompt-the-hyperrealistic-image-depicts-the-ma.jpg)
![O que foi informado ao sistema: imagem hiper-realista retrata um homem tirando uma selfie com os amigos em um cinema lotado. As pessoas assistem a uma comédia e riem muito — Foto: Imagem gerada por Midjourney](https://cdn.statically.io/img/s2-oglobo.glbimg.com/TkhlvrytsKlogH0eXZY-fb4mPF0=/689x0/smart/filters:strip_icc()/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/O/g/0AfkXETSefvFzCYpVhBw/106073085-ec-credito-imagem-gerada-por-ia-midjourney-prompt-the-hyperrealistic-image-depicts-the-ma.jpg)
O que foi informado ao sistema: imagem hiper-realista retrata um homem tirando uma selfie com os amigos em um cinema lotado. As pessoas assistem a uma comédia e riem muito — Foto: Imagem gerada por Midjourney
![No cinema. A figura que segura o celular tem as mãos deformadas — Foto: Imagem gerada por IA/Midjourney](https://cdn.statically.io/img/s2-oglobo.glbimg.com/vqNfZeZZF1m0mGH_iEKNrYjqSow=/0x0:1316x915/323x182/smart/filters:strip_icc()/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/Q/3/YOLFuJTWuG2HaoaVE25g/106073085-ec-credito-imagem-gerada-por-ia-midjourney-prompt-the-hyperrealistic-image-depicts-the-ma-1-.jpg)
![No cinema. A figura que segura o celular tem as mãos deformadas — Foto: Imagem gerada por IA/Midjourney](https://cdn.statically.io/img/s2-oglobo.glbimg.com/x-Xn4bu1ktM76c625ZuiKkkWk38=/1316x0/smart/filters:strip_icc()/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/Q/3/YOLFuJTWuG2HaoaVE25g/106073085-ec-credito-imagem-gerada-por-ia-midjourney-prompt-the-hyperrealistic-image-depicts-the-ma-1-.jpg)
No cinema. A figura que segura o celular tem as mãos deformadas — Foto: Imagem gerada por IA/Midjourney
Publicidade
![Harmonia: Um maestro conduz uma orquestra, rege com energia, a câmera está de costas para o maestro, os músicos estão de frente para a câmera, ele toca a Nona Sinfonia de Beethoven - Foto: imagem gerada por IA/Midjourney](https://cdn.statically.io/img/s2-oglobo.glbimg.com/JGn0rzYKl56kvwjd40tgdu83Mr0=/0x0:788x605/323x182/smart/filters:strip_icc()/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/w/w/WbJWvdQH6rEcsxxhBhzQ/106073097-ec-credito-imagem-gerada-por-ia-midjourney-prompt-a-conductor-leads-an-orchestra-conducts.jpg)
![Harmonia: Um maestro conduz uma orquestra, rege com energia, a câmera está de costas para o maestro, os músicos estão de frente para a câmera, ele toca a Nona Sinfonia de Beethoven - Foto: imagem gerada por IA/Midjourney](https://cdn.statically.io/img/s2-oglobo.glbimg.com/jchLBnz4xv3Bk7rLH-0NfAtxGQg=/788x0/smart/filters:strip_icc()/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/w/w/WbJWvdQH6rEcsxxhBhzQ/106073097-ec-credito-imagem-gerada-por-ia-midjourney-prompt-a-conductor-leads-an-orchestra-conducts.jpg)
Harmonia: Um maestro conduz uma orquestra, rege com energia, a câmera está de costas para o maestro, os músicos estão de frente para a câmera, ele toca a Nona Sinfonia de Beethoven - Foto: imagem gerada por IA/Midjourney
![Regência. A imagem exibe mão direita do maestro com dedo alongado. E a batuta se assemelha a um arco de violino — Foto: Imagem gerada por IA/Midjourney](https://cdn.statically.io/img/s2-oglobo.glbimg.com/DZLWWJiGRqcfNaAAtDvy8PaSXFc=/1248x0/smart/filters:strip_icc()/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/6/L/arZQ3aSguk4I4UnjeBBg/106073097-ec-credito-imagem-gerada-por-ia-midjourney-prompt-a-conductor-leads-an-orchestra-conducts.jpg)
Regência. A imagem exibe mão direita do maestro com dedo alongado. E a batuta se assemelha a um arco de violino — Foto: Imagem gerada por IA/Midjourney
Publicidade
![O que foi informado ao sistema de inteligência artificial: imagem exibe uma pessoa com os braços cruzados, não foi solicitado que aparecesse o rosto - foto: imagem criada por IA/Midjourney](https://cdn.statically.io/img/s2-oglobo.glbimg.com/NRKfo0zYSxhP5Tf9WnLMjOQ5qWE=/625x0/smart/filters:strip_icc()/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/P/q/XLsEZlQeOQQSVhw7lcwA/106073077-ec-credito-imagem-gerada-por-ia-midjourney.-prompt-with-arms-crosse.jpg)
O que foi informado ao sistema de inteligência artificial: imagem exibe uma pessoa com os braços cruzados, não foi solicitado que aparecesse o rosto - foto: imagem criada por IA/Midjourney
![Em excesso. Imagem gerada por inteligência artificial mostra uma pessoa com mais um braço — Foto: Imagem gerada por IA/Midjourney](https://cdn.statically.io/img/s2-oglobo.glbimg.com/_03jsUgiFSELbHOApAdOu0Szk3A=/1600x0/smart/filters:strip_icc()/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/R/E/2Rz8DUTJA8EZNPyQCoEQ/106073077-ec-credito-imagem-gerada-por-ia-midjourney.-prompt-with-arms-crosse.jpg)
Em excesso. Imagem gerada por inteligência artificial mostra uma pessoa com mais um braço — Foto: Imagem gerada por IA/Midjourney
Publicidade
![Alegria: Uma criança sorri imensamente feliz e até grita de boca aberta de tanta felicidade quando recebe um presente. Esta imagem serve como uma prova do poder da felicidade — Foto: Imagem gerada por IA/Midjourney](https://cdn.statically.io/img/s2-oglobo.glbimg.com/wI8JxbOb8dcgOdtOZMMMPznBg5I=/1272x0/smart/filters:strip_icc()/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/B/8/8rXBM7S5K4mld8A9KYiA/106073063-ec-dente1jpg-credito-imagem-gerada-por-ia-midjourney-prompt-a-child-smiles-immensely-happ.jpg)
Alegria: Uma criança sorri imensamente feliz e até grita de boca aberta de tanta felicidade quando recebe um presente. Esta imagem serve como uma prova do poder da felicidade — Foto: Imagem gerada por IA/Midjourney
![Sorriso assustador. O dente da criança que recebe o presente se confunde com a gengiva — Foto: Imagem gerada por IA/Midjourney](https://cdn.statically.io/img/s2-oglobo.glbimg.com/AZmP2OoerFUa1c-QQ7A4C8Hrmhw=/1600x0/smart/filters:strip_icc()/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/d/t/0mbdcPQcK2iBCko4ATCA/106073063-ec-dente1jpg-credito-imagem-gerada-por-ia-midjourney-prompt-a-child-smiles-immensely-happ-1-.jpg)
Sorriso assustador. O dente da criança que recebe o presente se confunde com a gengiva — Foto: Imagem gerada por IA/Midjourney
Publicidade
![Dueto inusitado: Produção exibe a cantora brasileira Anitta cantando com o líder do Coldplay, Crhis Martin, dançando e cantando no palco, com luz de neon — Foto: Imagem gerada por IA/Midjourney](https://cdn.statically.io/img/s2-oglobo.glbimg.com/TOHoW1u2hh7JwrU9maiGjOmbbUY=/1000x0/smart/filters:strip_icc()/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/i/m/sdP1QyQlCy3MhKLcoJ0g/106073079-ec-credito-imagem-gerada-por-ia-midjourney.-prompt-production-still-of-a-brazilian-singe-1-.jpg)
Dueto inusitado: Produção exibe a cantora brasileira Anitta cantando com o líder do Coldplay, Crhis Martin, dançando e cantando no palco, com luz de neon — Foto: Imagem gerada por IA/Midjourney
![Atenção ao vocalista. A mão direita do cantor Chris Martin aparece com seis dedos — Foto: Imagem gerada por IA/Midjourney](https://cdn.statically.io/img/s2-oglobo.glbimg.com/BcA_XwDkmnX0bgqhK_35uJQmVEQ=/1600x0/smart/filters:strip_icc()/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/n/c/WGBKgDQw67slQEjTU0NQ/106073079-ec-credito-imagem-gerada-por-ia-midjourney.-prompt-production-still-of-a-brazilian-singe.jpg)
Atenção ao vocalista. A mão direita do cantor Chris Martin aparece com seis dedos — Foto: Imagem gerada por IA/Midjourney
Publicidade
![Apreciando a vista. Um grupo de capivaras com a cidade do Rio de Janeiro ao fundo, em um dia de garoa, imagem no estilo de publicações voltadas para a vida animal — Foto: Imagem gerada por IA/Midjourney](https://cdn.statically.io/img/s2-oglobo.glbimg.com/czI_fBnJgzlc6905ED71t-s7Cw0=/1600x0/smart/filters:strip_icc()/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/B/O/bp8KovREqBQ5Pvb5AGjg/106086327-production-still-a-hundred-capybara-the-city-of-rio-de-janeiro-in-the-background-rain-driz.jpg)
Apreciando a vista. Um grupo de capivaras com a cidade do Rio de Janeiro ao fundo, em um dia de garoa, imagem no estilo de publicações voltadas para a vida animal — Foto: Imagem gerada por IA/Midjourney
![É esse animal mesmo? Capivara aparece de rabo e mais parece um rato — Foto: Imagem gerada por IA/Midjourney](https://cdn.statically.io/img/s2-oglobo.glbimg.com/ijWsS4rwau69tZ3V7M16bPt_YR4=/1304x0/smart/filters:strip_icc()/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/k/H/QAJqWJRlyhC5cEASVPCA/106086327-production-still-a-hundred-capybara-the-city-of-rio-de-janeiro-in-the-background-rain-driz-2-.jpg)
É esse animal mesmo? Capivara aparece de rabo e mais parece um rato — Foto: Imagem gerada por IA/Midjourney
Publicidade
"Alucinações são um problema crítico para sistemas de geração de linguagem natural, como o ChatGPT e o Gemini, porque os usuários não podem confiar que uma dada resposta está correta", afirmam os pesquisadores.
"Respostas suspeitas ou sem a necessária informação impedem a adoção de LLMs em diversas áreas. Entre os problemas estão a invenção de antecedentes legais e de fatos inverídicos em notícias em algumas áreas da medicina, como a radiologia, podem até apresentar risco de morte."
- Está farto de spam? Prepare-se: chegou a era do slop
A solução que o grupo de Farquhar encontrou para minimizar o problema foi a de submeter as respostas fornecidas por LLMs ao processamento por um segundo LLM, depois um terceiro. O que esse sistema extra de IA faz é analisar como a construção da resposta foi feita em termos de semântica, ou seja, de significado das frase construídas.
E para fazer essa análise, os cientistas emprestaram um conceito da física: a entropia, que serve para medir o caos e a aleatoriedade de um sistema.
No estudo, os pesquisadores explicam que quando um LLM produz uma resposta, ele precisa selecioná-la em meio a um conjunto de possíveis respostas que o próprio sistema cria. Quando possui pouca informação de base para dar uma resposta complexa, o sistema gera uma porcentagem mais alta de respostas que têm sentido diferente, apesar de embutirem um grupo de palavras parecidas. Em outras palavras, dados incertos levam a um maior caos interno para o sistema manejar.
Uma propriedade interessante desse caos, ou entropia, é que ele pode ser medido por segundo LLM acoplado ao sistema. E, por fim, um terceiro LLM pode ser acoplado para interpretar essa medida e dizer quão provável é uma resposta do sistema ser produto de confabulação. Essa é a arquitetura proposta pelo grupo de Oxford para aprimorar o sistema como um todo.
Para testar a ideia, Farquhar criou sistemas de avaliação para respostas oferecidas por três ferramentas de IA já existentes. O teste foi feito com o Llama 2 (do Facebook), Mistral Instructor (da empresa francesa Mistral) e Falcon (do Instituto de Inovação Tecnológica de Dubai), que providenciaram código aberto para a pesquisa. ChatGPT e Gemini não entraram no experimento.
Fogo contra fogo
No estudo, os pesquisadores relatam boas taxas de acerto dos sistemas avaliados (de 70% a 80%) em apontar alucinações desses sistemas em pequenas biografias geradas por inteligência artificial, além de questões de saúde e de conhecimento geral.
Em um artigo independente publicado pela própria Nature, uma outra cientista da computação comentou o avanço. Karin Vespoor, do Royal Melbourne Institute of Technology, da Austrália, reconheceu a engenhosidade do grupo em criar um método para detectar alucinações, mas afirma que ele precisa ser usado com cautela.
"Os autores do estudo propõem que LLMs podem formar um componente integral de uma estratégia para controlar outros LLMs. Em resumo, a abordagem deles consiste em usar fogo para combater o fogo", diz a cientista.
Segundo Farquhar, essa preocupação não impede, porém, que seu sistema seja implementado de maneira útil para usuários.
"A detecção de confabulações permite que os sistemas construídos em LLMs evitem responder a perguntas que possam causar confabulações, alertem os usuários da falta de confiabilidade das respostas a uma pergunta ou suplementem o LLM com uma pesquisa e coleta de dados mais fundamentada", afirma o cientista.