Pedro Doria
PUBLICIDADE
Pedro Doria

Jornalista

Informações da coluna

Pedro Doria

Sem fazer muito alarde, a Meta divulgou uma nova política de privacidade em que revela: usará o que publicamos no Facebook e no Instagram para treinar sua inteligência artificial. Provavelmente tinha a esperança de que ninguém percebesse. Não deu. A União Europeia mandou barrar a mudança — por lá, já existe regulação suficiente para isso. Nos Estados Unidos e por aqui não teve jeito. Fomos atropelados. Mas, por trás da notícia, existem alguns debates importantes. O primeiro é sobre autoria. Sobre direito autoral.

Um modelo de IA requer grande quantidade de dados para ser treinado. Se é um modelo que gera imagens, precisa de muitas imagens. Se gera texto, exigirá muito texto. Vídeo — mesma coisa. Quanto maior o banco de dados, quanto maior o poder de processamento dos computadores que treinam esses modelos, melhor o modelo de IA. A Microsoft pretende investir US$ 100 bilhões nos próximos quatro anos em parques de computadores só para treinar modelos mais e mais sofisticados.

Esse material não é fielmente reproduzido. Um modelo voltado para imagens, como DALL-E ou Midjourney, não produz uma Guernica igualzinha só porque as obras completas de Pablo Picasso fizeram parte do treinamento. Os dados servem a modelos estatísticos, alimentam a compreensão que o sistema tem do que compõe uma frase, de como representar um cavalo, ou mesmo um cavalo em desespero no estilo cubista. Não há plágio.

Mas há problemas. Existe um número pequeno de artistas que produzem imagens para manuais de Dungeons & Dragons, um RPG, jogo baseado em livros e histórias bastante populares. Esses artistas não são muitos, mas, no mercado americano, conseguiam viver de produzir aquelas imagens com dragões, duendes, magos e cavaleiros para os livros com roteiros de jogos, que vendem como água. Esse mercado está desaparecendo. Como os modelos mais sofisticados foram treinados com muita gente naquele estilo, as editoras não precisam mais pagar caro pelas artes. A IA faz.

Capa do audio - Pedro Doria - Vida Digital CBN

Os artistas não foram remunerados pelo uso de seus estilos no treinamento e, agora, o computador faz com bastante qualidade o trabalho deles.

É um problema ético novo. Não está claro como se encaixa o direito autoral nisso. A OpenAI, responsável pelo ChatGPT, vem assinando contratos de cessão de direitos com veículos de imprensa. O Financial Times é um deles. Por via das dúvidas, a empresa achou melhor começar a pagar para usar. Foi também processada pelo New York Times — afinal, treinou o GPT 4 usando o acervo do jornal sem pedir licença. Inúmeros escritores, entre eles Stephen King e John Grisham, como o Times, processaram a companhia. Pela mesma razão — há livros inteiros deles usados para treino.

Muitos na indústria de tecnologia argumentam que o treino configura uso legítimo — fair use, em inglês. Pode-se mexer na letra de uma música para uma paródia, e aí não é plágio. É uso legítimo. Há muito existe essa provisão no debate sobre direitos autorais. Todos podemos nos alimentar da cultura que existe para construir algo original que, ainda assim, seja uma referência ao que foi previamente concebido. Será que não se enquadra? É um argumento.

Mas há uma discussão mais profunda aí. Não lidamos bem, na verdade lidamos cada vez pior, com as grandes plataformas gratuitas da internet. Não importa se é uma rede social, um grande portal de vídeos, hospedagem de blogs. Se é gratuito, se não pagamos nada para estar lá, é porque o produto somos nós. Estamos constantemente produzindo conteúdo, todos, para que as plataformas ganhem dinheiro. E elas são as companhias mais bem-sucedidas da história do capitalismo.

Sabemos disso. Sabemos que trabalhamos de graça. Que o retorno é pequeno e para poucos. O YouTube é exceção, compartilha um pouco de seus ganhos. É só um pouco, porém muito mais que as outras. As plataformas da Meta são uma piada — não devolvem praticamente nada nem àqueles com milhões de seguidores que trabalham diligentemente para ganhar de outras formas. O TikTok não é muito diferente.

As plataformas consideram que o conteúdo que produzimos coletivamente é delas. Podem não dizer isso com clareza, mas seu negócio é ganhar dinheiro com nosso trabalho. E ainda assim trabalhamos. Como facilitam também a manipulação política, foram capazes de erguer uma blindagem com parlamentares que se interessam em manter o jogo como está. Sistematicamente, aqui como nos Estados Unidos, a tentativa de regular não prospera.

O debate sobre direito autoral na inteligência artificial é complexo. O debate sobre a postura das plataformas, não. Esse é bem simples.

Mais recente Próxima O Google quer reinventar a IA