Compartilhe este artigo

O aprendizado de máquina que impulsiona os NFTs de arte generativa

A arte generativa tem sido um dos casos de uso por excelência do aprendizado de máquina, mas somente recentemente o espaço ganhou destaque no mercado.

A inteligência artificial (IA) no espaço de tokens não fungíveis (NFT) está se tornando cada vez mais relevante. A arte generativa (ou seja, arte que foi criada por um sistema autônomo) rapidamente emergiu como uma das principais categorias do mercado de NFT, impulsionando projetos inovadores e coleções surpreendentes. Das obras de lendas da arte de IA, como Refik Anadol ou Sofia Crespo, até Novo projeto QQL de Tyler HobbsOs NFTs se tornaram um dos principais veículos para acessar arte alimentada por IA.

A arte generativa tem sido um dos casos de uso de aprendizado de máquina por excelência, mas só recentemente o espaço alcançou destaque no mainstream. O salto foi impulsionado principalmente por ganhos computacionais e uma nova geração de técnicas que podem ajudar os modelos a Aprenda sem exigir muitos conjuntos de dados rotulados, que são incrivelmente limitados e caros para construir. Embora a lacuna entre a comunidade de arte generativa e a pesquisa de IA tenha diminuído nos últimos anos, muitas das novas técnicas de arte generativa ainda T foram amplamente adotadas por artistas proeminentes, pois leva um tempo para experimentar esses novos métodos.

A História Continua abaixo
Não perca outra história.Inscreva-se na Newsletter The Node hoje. Ver Todas as Newsletters

Jesus Rodriguez é o CEO da IntoTheBlock.

Os catalisadores da arte generativa

A ascensão da IA generativa foi uma surpresa até mesmo para muitos dos pioneiros da IA que viam essa disciplina principalmente como uma área relativamente obscura do aprendizado de máquina. O progresso impressionante na IA generativa pode ser rastreado até três fatores principais:

  • IA multimodal: Nos últimos cinco anos, vimos uma explosão de métodos de IA que podem operar em diferentes domínios, como linguagem, imagem, vídeo ou som. Isso permitiu a criação de modelos comoDALL-Eou Difusão Estável, que geram imagens ou vídeos a partir da linguagem natural.
  • Modelos de linguagem pré-treinados: O surgimento da IA multimodal foi acompanhado por um progresso notável em modelos de linguagem com métodos comoGPT-3. Isso permitiu o uso da linguagem como um mecanismo de entrada para produzir saídas artísticas, como imagens, sons ou vídeos. A linguagem desempenhou um papel primordial nesta nova fase da IA generativa, pois reduziu a barreira para as pessoas interagirem com modelos de IA generativa.
  • Métodos de difusão: A maioria das artes fotorrealistas produzidas por métodos de IA que vemos hoje é baseada em uma técnica chamada modelos de difusão. Antes dos modelos de difusão entrarem em cena, o espaço de IA generativa era dominado por métodos como redes adversárias generativas (GAN) ou codificadores automáticos variacionais (VAE), que têm problemas de escala e sofrem com a falta de diversidade de saídas geradas. Os modelos de difusão abordam essas limitações seguindo uma abordagem não convencional de destruir as imagens de dados de treinamento até que sejam ruído completo e reconstruí-las novamente. O raciocínio é que se um modelo é capaz de reconstruir uma imagem de algo que é, teoricamente, ruído, então ele deve ser capaz de fazer isso de praticamente qualquer representação, incluindo outros domínios como a linguagem. Não surpreendentemente, os métodos de difusão se tornaram a base dos modelos de geração de texto para imagem, como DALL-E e Stable Diffusion.

A influência desses métodos na arte generativa coincidiu com o surgimento de outra tendência Tecnologia : os NFTs, que desbloquearam recursos incrivelmente importantes para a arte digital, como propriedade digital, incentivos programáveis ​​e modelos de distribuição mais democratizados.

Veja também:Por que os artistas NFT T devem esperar 'royalties' | Opinião

Os métodos que impulsionam a arte generativa em NFTs

Texto para imagem:A síntese de texto para imagem (TTI) tem sido a área mais popular de IA generativa dentro da comunidade NFT. O espaço TTI produziu alguns modelos de IA que estão literalmente transcendendo para a cultura pop. OpenAI’sDALL-Etornou-se sem dúvida o exemplo mais conhecido de TTI usado para gerar imagens artísticas.DESLIZARé outro modelo TTI criado pela OpenAI, que foi adotado em muitos cenários de arte generativa. O Google tem se aventurado no espaço da arte generativa, experimentando diferentes abordagens, comoImagem, que se baseia em modelos de difusão, ouParte, que é baseado em uma técnica diferente chamada modelos autorregressivos. Meta também vem cultivando a comunidade de arte generativa com modelos comoFaça uma cena. As startups de IA também estão fazendo incursões no espaço TTI com modelos comoNo meio da jornadaganhando uma comunidade vibrante por meio de sua distribuição Discord eEstabilidade IAchocando a comunidade de IA pordifusão estável de código aberto.

Da perspectiva dos NFTs, os modelos TTI tiveram a adoção mais ampla porque uma porcentagem desproporcional de itens colecionáveis de arte digital hoje são representados como imagens estáticas.

Texto para vídeo: Texto para vídeo (TTV) é um aspecto mais desafiador da arte generativa, mas um no qual estamos vendo um grande progresso. Meta e Google publicaram recentemente modelos TTV como Faça um vídeo e Imagem Vídeo, que pode gerar videoclipes de alta fidelidade de quadros com base em linguagem natural. O vídeo é uma das áreas mais ativas de pesquisa para arte generativa, e devemos esperar que a maioria dos modelos de geração de imagens tenha equivalentes em vídeo. Os vídeos ainda não são tão proeminentes no espaço NFT quanto as imagens, mas isso provavelmente mudará à medida que os modelos TTV se tornarem mais amplamente adotados por artistas generativos. O vídeo é uma das áreas que diferencia a arte digital da arte tradicional.

Leia Mais: NFTs podem e serão muito mais| Opinião

Imagem para imagem:A geração de imagens por meio de entradas textuais parece quase natural, mas tem limitações quando se trata de capturar aspectos como posições entre diferentes objetos, orientação ou mesmo detalhes muito específicos do cenário. Esboços ou outras imagens são um mecanismo melhor para transmitir essas informações. Vários dos principais modelos de difusão, comoDALL-E,Difusão estável e Imagemtodos incorporam mecanismos para gerar imagens a partir de sketchers. Similarmente, esses modelos incorporam técnicas como in-painting ou out-painting, que permitem estender imagens dentro ou além de suas bordas originais.

A maioria das práticas de arte generativa mais bem estabelecidas focam na criação de imagens a partir de outras imagens. Não é de surpreender que várias coleções populares de NFT de arte generativa sejam baseadas em variações de métodos de imagem para imagem.

Geração musical:A geração automática de música tem sido outro caso de uso comum em IA generativa que ganhou destaque nos últimos anos. A OpenAI também tem estado na vanguarda dessa revolução com modelos incluindoMuseNete, mais proeminentemente,Juke-box, que é capaz de gerar música em vários estilos e gêneros. Recentemente, o Google entrou no espaço comÁudioLM, um modelo que cria discurso realista e música de piano simplesmente ouvindo trechos de som. Estabilidade apoiada por IAHarmoniacomeçou a expandir os limites do espaço de geração de música de IA com o lançamento deDifusão de dança, um conjunto de algoritmos e ferramentas que podem gerar clipes originais de música.

A música gerada por IA é uma das maiores áreas em que os NFTs podem entregar valor único. Diferente de outras formas de arte, a música é distribuída em formato digital. A IA generativa pode evoluir para um complemento natural para produtores musicais, e os NFTs oferecem aos criadores maneiras únicas de expressar propriedade em clipes musicais ou músicas.

Uma combinação invejável: NFTs e arte generativa

Ao longo da história da Tecnologia , houve vários casos em que tendências relativamente diferentes foram capazes de influenciar umas às outras para ganhar uma incrível fatia de mercado. O exemplo mais recente é a revolução social-móvel-nuvem, na qual cada uma dessas tendências expandiu o mercado das outras duas. IA generativa e NFTs estão começando a exibir uma dinâmica semelhante. Ambas as tendências foram capazes de trazer um mercado de Tecnologia complexo para a cultura dominante. NFTs complementam a IA generativa com modelos de propriedade e distribuição digitais que seriam quase impossíveis de implementar de outra forma. Da mesma forma, a IA generativa provavelmente se tornará uma das fontes mais importantes de criação de NFT.

Nota: As opiniões expressas nesta coluna são do autor e não refletem necessariamente as da CoinDesk, Inc. ou de seus proprietários e afiliados.

Jesus Rodriguez

Jesus Rodriguez é o CEO e cofundador da IntoTheBlock, uma plataforma focada em habilitar inteligência de mercado e soluções DeFi institucionais para Mercados de Cripto . Ele também é o cofundador e presidente da Faktory, uma plataforma de IA generativa para aplicativos empresariais e de consumo. Jesus também fundou a The Sequence, uma das Newsletters de IA mais populares do mundo. Além de seu trabalho operacional, Jesus é palestrante convidado na Columbia University e na Wharton Business School e é um escritor e palestrante muito ativo.

Jesus Rodriguez