Compartilhe este artigo

A verdade sobre inteligência artificial e criatividade

A inteligência artificial permite que os criadores sejam criativos, mas mesmo IAs sofisticadas são, na verdade, apenas uma forma avançada de cópia, diz David Z. Morris. Este recurso faz parte da Semana da Cultura da CoinDesk.

O ano passado foi uma festa de apresentação muito bem-sucedida para versões avançadas de dois tipos de inteligência artificial. Ficamos impressionados com modelos de linguagem grande, ou LLM, que podem imitar uma conversa amigável ou uma lição de casa de história de um colegial. E ficamos impressionados com processadores de arte, incluindo Midjourney e Stable Diffusion.

Os modelos são brinquedos divertidos, e alguns podem se tornar confiáveis o suficiente para ter aplicações comerciais sérias. Mas LLMs e processadores de imagem enfrentam um limite importante, até mesmo definidor: tanto LLMs quanto seus equivalentes gráficos operam inteiramente copiando trabalhos existentes.

Este recurso faz parte do CoinDeskSemana da Cultura.

Isso rapidamente levou a processos judiciais contra empresas de IA que treinaram seus modelos sem pagar para licenciar adequadamente imagens de treinamento ou outros dados. Esses processos são uma continuação irônica da onda de bloqueios de propriedade intelectual (PI) da década de 1990, que começou com controles mais rígidos sobre amostragem de música e culminou no Digital Millennium Copyright Act (DMCA) de 1998. Essas regras foram impostas pelo mesmo tipo de grandes conglomerados que agora estão criando IAs - e lutando por seu direito de, pelo menos de acordo com os críticos, roubar o que quiserem.

Os artistas se sentem ameaçados, com razão, pelo impulso explorador dos Googles e Microsofts do mundo – mas também veem promessa na IA. A produtora e vocalista Holly Herndon está entre aqueles que veem a IA como uma ferramenta potencial para sua criatividade, em vez de estritamente uma ameaça à sua capacidade de ganhar a vida com isso. Mas esse futuro, amigável tanto para artistas quanto para IA, só pode existir sob o regime certo de leis e práticas de PI. Os primeiros esforços para desenvolver tal estrutura incluem experimentos com tokens não fungíveis (NFT) e outras ferramentas de blockchain.

Autocompletar glorificado

A alegação de que os modelos de IA não fazem nada além de copiar surpreenderá muitos, especialmente aqueles que apreciaram seus resultados, muitas vezes incrivelmente bons, mas T sabem como eles realmente funcionam.

A saída é tão impressionante porque o que as IAs fazem é um tipo avançado e matizado de cópia. Em vez de levantar frases ou imagens específicas, elas extraem e regurgitam os padrões subjacentes da expressão Human . É por isso que alguns chamaram as IAs de LLM de “autocompletar com esteroides”.

Leia Mais: Cripto Long & Short: Encontrando Alpha em Cripto Relacionado à IA

“Em um nível literal, essas redes neurais são treinadas para fazer uma coisa e somente uma coisa, que é prever a próxima palavra”, diz Beerud Sheth, fundador da Elance (agora Upwork) e agora CEO da desenvolvedora de chatbots Gupshup. “O milagre é que o preenchimento automático com esteroides é, na verdade, uma descrição muito boa de muita linguagem Human ... Ele cria todos os tipos de coisas incríveis.”

Esses resultados surpreendentes podem MASK a simplicidade fundamental do que está acontecendo sob o capô. Enquanto eles estão realmente apenas fazendo malabarismos com números e fazendo suposições probabilísticas com base em trabalhos pré-existentes, chatbots e IAs de arte mostraram que podem enganar alguns a acreditar que são criativos, ou mesmoautoconsciente.

Grandes modelos de furto

Os criadores de IAs se beneficiam dessa percepção equivocada, e alguns têm sutilmente fomentado isso. Até mesmo o termo cada vez mais padrão “IA generativa” implica mais originalidade do que esses bots realmente têm. Esse exagero ajuda a fomentar percepções irrealistas do que a Tecnologia é capaz de fazer – mais importante, entre os investidores.

Isso não é tão novo: empresas de tecnologia, do Facebook ao Uber, passaram grande parte de uma década prometendo que a IAajudá-los a escalar ealcançar lucratividade. Essas promessas antigas permanecem totalmente por cumprir e, após menos de um ano, as sérias limitações até mesmo da nova onda de modelos de linguagem avançados feito eles mesmos conhecido.

Mas talvez ainda mais útil do que enganar investidores de Big Tech, a mistificação da IA “expressiva” ajuda a desviar a atenção de como ela geralmente funciona: por meio de violação de direitos autorais em grande escala.

“Tudo o que um LLM sabe vem de expressão protegida por direitos autorais”, argumenta o advogado de propriedade intelectual Matthew Butterick. “Não há momento em que ele se torna um gerador de ideias subjacentes.”

Butterick está buscando o que ele diz serem os dois primeiros grandes processos judiciais visando consagrar esse argumento na jurisprudência, e ele espera que casos semelhantes se multipliquem nos próximos anos. Tal litígio pode representar um grande obstáculo à lucratividade de algumas aplicações de IA, que podem ser forçadas a pagar taxas de licenciamento para todas asmilhões de peças de expressão criadas pelo homemusado para treiná-los.

Leia Mais: Megan DeMatteo - Como a IA está mudando a criação artística e desafiando as leis de propriedade intelectual

“Quando você segue esse caminho de argumentar, ‘São alguns dados derivados da imagem de uma certa maneira’, bem, isso é apenas uma cópia”, diz Butterick. “É apenas uma maneira sofisticada de descobrir como armazenar os dados e regenerá-los mais tarde.” O renomado jornalista científico e escritor de ficção científica Ted Chiang recentemente fez praticamente o mesmo ponto na revista New Yorker: Chatbots e outros geradores de IA, como ele disse, são mais bem compreendidos como “um JPEG borrado da web”.

Butterick espera tornar essa visão de chatbots e geradores de imagens parte da doutrina jurídica. Butterick representa um trio de artistas em um processo como parte de umação coletivaarquivado em janeiro contra os geradores de imagens de IA Stability AI, Midjourney e DeviantArt. O processo argumenta que seu modelo de imagem de IA foi treinado usando imagens sem licença. A Getty Images fez alegações semelhantes em um subsequenteação por infração. Butterick também está liderando umação coletiva contra a Copilot, um esforço apoiado pela Microsoft para usar IA para criar código de computador – o que é feito roubando código criado por humanos, em parte do repositório de código aberto Github.

O Copilot em particular, diz Butterick, foi pego simplesmente cortando e colando grandes blocos de código de desenvolvedores Human em sua saída supostamente "generativa". Ele também oferece a seus clientes uma indenização de meio milhão de dólares contra processos de violação de direitos autorais por código que eles implantam, o que sugere fortemente que a Microsoft entende que está brincando com fogo.

(Holly Herndon/YouTube)
(Holly Herndon/YouTube)

Precedente funky

Tudo isso, argumenta Butterick, viola claramente padrões de direitos autorais bem estabelecidos. Um momento importante no desenvolvimento desses padrões girou em torno de uma inovação tecnológica anterior: ferramentas de amostragem digital.

Muitos precedentes legais importantes em PI derivam do uso de samples na música hip hop, uma prática que produziu uma inovação criativa impressionante e obras-primas como “It Takes a Nation of Millions to Hold Us Back” do Public Enemy e “It Takes a Nation of Millions to Hold Us Back” dos Beastie Boys/Dust Brothers.“Boutique do Paul.”

Mas quando os discos baseados em samples começaram a dar dinheiro, as gravadoraslevou artistas ao tribunal. Em meados da década de 1990, eles criaram um regime de liberação de samples caro e difícil de manejar que efetivamente acabou com o tipo de faixas ricamente em camadas baseadas em samples que davam à prática sua moeda cultural e valor econômico, em primeiro lugar.

Um exemplo notável do que essa restrição custa a todos é “The Grey Album”, um mashup de 2004 de músicas dos Beatles e Jay-Z que lançou a carreira do produtor Danger Mouse. Embora amplamente admirado (enão é tão difícil de encontrar), nunca teve um lançamento comercial e provavelmente nunca terá. Isso T só torna mais difícil para os fãs ouvirem – Danger Mouse, Jay-Z e os Beatles também estão perdendo receita.

Não há momento em que ele se torne um gerador de ideias subjacentes.

Agora, diz Butterick, muitos dos mesmos tipos de grandes detentores de PI que lutaram por esses controles restritivos querem ter o CAKE e comê-lo também.

“A Microsoft [é] uma das maiores donas de IP na América. E agora eles estão tipo, queremos acesso a todo o código, para sempre, de graça. A ironia: você pode ficar cavando por dias.”

Artistas no controle

“Acho que podemos refazer como o IP funciona”, diz o produtor musical e ciberteórico Mat Dryhurst. “Alguns artistas serão mais permissivos, outros mais protetores, e isso é bom. No final das contas, deve ficar a critério do artista.”

Dryhurst faz parte da equipe criativa por trás do produtor, cantor (eDoutorado pela Universidade de Stanford) Holly Herndon. Embora uma IA de processamento generalizada possacopie o estilo de qualquer artista de graça, Herndon e sua equipe estão tentando vencer os deepfakers em seu próprio jogo, criando sua própria imitadora de IA, Holly+. Holly+ é um filtro de IA treinado na própria voz de Herndon. Ele pode ser usado por outros cantores que querem soarestranhamente como Herndon. Também pode ser usado para criar faixas no estilo de Herndon do zero, como em um cover recente deO clássico “Jolene” de Dolly Parton.

Dryhurst e Herndon também fazem parte da equipe daDesova.ai, uma organização que cria “ferramentas de IA para artistas, por artistas”. Seu primeiro projeto, agora em beta, éhaveibeentrained.com, que visa ajudar os artistas a controlar o uso de suas obras por grandes modelos de IA.

Leia Mais: Caitlin Burns - IA e Cripto Estão se Combinando para Criar a 'Era Multijogador' da Web3

Mas o objetivo definitivamente não é parar esse uso completamente. Em vez disso, Dryhurst, em uma troca de e-mail, escreveu que quer que cada artista crie sua própria IA, em vez de ter o trabalho de todos despejado em um único modelo uniforme.

“Meu ideal seria que os modelos grandes do substrato base fossem despojados de tantos dados quanto possível que possam invadir a capacidade de um artista de tornar seus dados economicamente produtivos”, ele diz, “e avançar para… um modelo base relativamente limpo que suporte modelos mais específicos que sejam de propriedade e controlados pelos próprios artistas.”

Se os artistas podem construir e controlar seus próprios modelos, eles também podem controlar a colaboração por meio desses modelos e ganhar dinheiro com eles. Em contraste, grandes organizações de IA como a Microsoft e a OpenAI estão, em essência, pressionando pelo direito de ingerir toda a produção cultural em modelos grandes e centralizados sobre os quais os artistas T têm controle algum.

A equipe de Herndon usou o Holly+ como um campo de testes para esse futuro de IA aprimorado. Herndon exerce controle criativo e um grau de controle financeiro sobre quem pode usar os modelos Holly+, incluindo a triagem de gravações feitas com o Holly+ antes de aprovar lançamentos públicos (embora Dryhurst diga que eles aprovam quase tudo que é "meio legal").

Eles e outros também experimentaram NFTs como uma forma de permitir acesso ou gerar receita para produções Holly+. E embora isso dependesse de mudanças no regime legal de PI mais amplo, não é difícil imaginar um futuro de gerenciamento descentralizado de PI, incluindo para treinamento de IA, que se baseie em ferramentas de blockchain.

Com seu equilíbrio particular de amplo acesso e controle granular, os blockchains são, no mínimo, um modelo conceitual melhor de como os artistas gostariam de gerenciar seus direitos do que os grandes modelos centralizados que atualmente ameaçam devorar o mundo — e deixar os artistas de fora.

Correção 20/03/20: Corrigidos detalhes de uma ação coletiva contra Stability AI, Midjourney e DeviantArt liderada por Michael Butterick.


David Z. Morris

David Z. Morris foi o Colunista Chefe de Insights da CoinDesk. Ele escreve sobre Cripto desde 2013 para veículos como Fortune, Slate e Aeon. Ele é o autor de "Bitcoin is Magic", uma introdução à dinâmica social do Bitcoin. Ele é um ex-sociólogo acadêmico de Tecnologia com PhD em Estudos de Mídia pela Universidade de Iowa. Ele detém Bitcoin, Ethereum, Solana e pequenas quantidades de outros ativos Cripto .

David Z. Morris