Cinco métodos de aprendizado de máquina que os comerciantes de Cripto devem conhecer
As Finanças Cripto quantitativas têm uma ampla gama de técnicas de aprendizado de máquina para recorrer. Aqui estão cinco, explicadas por suas características.
Em um recenteartigo, discuti a relevância que as técnicas de aprendizado de máquina que alimentam o famoso GPT-3 da OpenAI poderiam ter para o mercado de Cripto . O GPT-3 – que pode responder perguntas, executar análises de linguagem e gerar texto – pode ser a conquista mais famosa dos últimos anos do espaço de aprendizado profundo. Mas, de forma alguma, é o mais aplicável ao espaço de Cripto . Neste artigo, gostaria de discutir algumas novas áreas de aprendizado profundo que podem ter um impacto NEAR imediato nos modelos Quant aplicados à Cripto.
Jesus Rodriguez é o CEO da IntoTheBlock, uma plataforma de inteligência de mercado para Cripto . Ele ocupou cargos de liderança em grandes empresas de Tecnologia e fundos de hedge. Ele é um investidor ativo, palestrante, autor e palestrante convidado na Universidade de Columbia em Nova York.
Modelos como GPT-3 ou BERT do Google são o resultado de um grande avanço no aprendizado profundo conhecido como modelos de linguagem pré-treinados e transformadores. Essas técnicas, sem dúvida, representam o maior marco nos últimos anos da indústria de aprendizado profundo e seu impacto T passou despercebido nos Mercados de capital.
No último ano, houve esforços ativos de pesquisa em Finanças quantitativas explorando como modelos de transformadores podem ser aplicados a diferentes classes de ativos. No entanto, os resultados desses esforços permanecem incompletos, mostrando que os transformadores estão longe de estar prontos para operar em conjuntos de dados financeiros e permanecem principalmente aplicáveis a dados textuais. Mas não há razão para se sentir mal. Embora adaptar transformadores a cenários financeiros continue sendo relativamente desafiador, outras novas áreas do espaço de aprendizado profundo estão se mostrando promissoras quando aplicadas em modelos Quant em várias classes de ativos, incluindo Cripto.
De muitos ângulos, a Cripto parece ser a classe de ativos perfeita para modelos Quant baseados em aprendizado profundo. Isso se deve ao DNA digital e à transparência dos ativos Cripto e que a ascensão da Cripto coincidiu com o renascimento do aprendizado de máquina e o surgimento do aprendizado profundo.
Após décadas de luta e alguns dos chamados “invernos de inteligência artificial (IA)”, o aprendizado profundo finalmente se tornou real e um tanto popular em diferentes áreas da indústria de software. As Finanças quantitativas têm sido uma das que mais rapidamente adotaram novas tecnologias e pesquisas de aprendizado profundo. É muito comum que alguns dos principais fundos Quant do mercado experimentem os mesmos tipos de ideias vindas de laboratórios de pesquisa de IA de alta tecnologia, como Facebook, Google ou Microsoft.
Veja também:Jesus Rodriguez - 10 razões pelas quais as estratégias Quant para Cripto falham
Alguns dos desenvolvimentos mais empolgantes no financiamento Quant moderno não vêm de técnicas chamativas como transformadores, mas de avanços empolgantes de aprendizado de máquina que são mais desenvolvidos para cenários Quant . Muitos desses métodos são perfeitamente aplicáveis a técnicas Quant de criptoativos e estão começando a fazer incursões em modelos Quant de Cripto .
Abaixo, listei cinco áreas emergentes de deep learning que são particularmente importantes para cenários Cripto Quant . Tentei KEEP as explicações relativamente simples e adaptadas para cenários Cripto .
1) Redes neurais de grafos
Os conjuntos de dados de blockchain são uma fonte única de alfa para modelos Quant no espaço Cripto . De uma perspectiva estrutural, os dados de blockchain são intrinsecamente hierárquicos e são representados por um gráfico com nós representando endereços conectados por arestas representando transações. Imagine um cenário em que um modelo Quant está tentando prever a volatilidade em Bitcoinem uma determinada troca com base nas características dos endereços que transferem fundos para a troca. Esse tipo de modelo precisa operar eficientemente sobre dados hierárquicos. Mas a maioria das técnicas de aprendizado de máquina são projetadas para trabalhar com conjuntos de dados tabulares, não gráficos.
Redes neurais de grafos (GNNs) são uma nova disciplina de aprendizado profundo que se concentra em modelos que operam eficientemente em estruturas de dados de grafos. GNNs são uma área relativamente nova de aprendizado profundo, tendo sido inventada apenas em 2005. No entanto, GNNs têm visto muitas adoções de empresas como Uber, Google, Microsoft, DeepMind e outras.
Em nosso cenário de amostra, uma GNN poderia usar um gráfico como entrada representando os fluxos de entrada e saída de exchanges e inferir conhecimento relevante para seu impacto no preço. No contexto de Cripto , as GNNs têm o potencial de habilitar novos métodos Quant baseados em conjuntos de dados de blockchain.
2) Modelos generativos
Uma das limitações dos modelos Quant de aprendizado de máquina é a falta de grandes conjuntos de dados históricos. Suponha que você esteja tentando construir um modelo preditivo para o preço de Chainlink (LINK) com base em seu comportamento histórico de negociação. Embora o conceito pareça atraente, pode ser desafiador, pois o LINK tem pouco mais de um ano de dados históricos de negociação em bolsas como a Coinbase. Esse pequeno conjunto de dados será insuficiente para a maioria das redes neurais profundas generalizarem qualquer conhecimento relevante.
Modelos generativos são um tipo de método de aprendizado profundo especializado em gerar dados sintéticos que correspondem à distribuição de um conjunto de dados de treinamento. Em nosso cenário, imagine que treinamos um modelo generativo na distribuição do livro de ordens de LINK na Coinbase para gerar novas ordens que correspondem à distribuição do livro de ordens real.
Combinando o conjunto de dados real e o ONE, podemos construir um conjunto de dados grande o suficiente para treinar um modelo sofisticado de aprendizado profundo. O conceito de modelo generativo não é particularmente novo, mas ganhou muita força nos últimos anos com o surgimento de técnicas populares, como redes neurais adversariais generativas (GANs), que se tornaram um dos métodos mais populares em áreas como classificação de imagens e têm sido usadas com sucesso relevante com conjuntos de dados financeiros de séries temporais.
3) Aprendizagem semi-supervisionada
Conjuntos de dados rotulados são escassos no espaço Cripto e isso limita severamente o tipo de modelos Quant de machine learning (ML) que podem ser construídos em cenários do mundo real. Imagine que estamos tentando construir um modelo de ML que faz previsões de preços com base na atividade de mesas de balcão (OTC). Para treinar esse modelo, precisaríamos de um grande conjunto de dados rotulados com endereços pertencentes a mesas de balcão, que é o tipo de conjunto de dados que apenas algumas entidades no mercado Cripto possuem.
Aprendizagem semissupervisionada é uma técnica de aprendizado profundo que foca na criação de modelos que podem Aprenda com pequenos conjuntos de dados rotulados e um grande volume de dados não rotulados. Aprendizagem semissupervisionada é análoga a um professor que apresenta alguns conceitos a um grupo de alunos e deixa os outros conceitos para dever de casa e autoestudo.
Em nosso cenário de amostra, imagine que treinamos um modelo com um pequeno conjunto de negociações rotuladas de mesas OTC e um grande conjunto de negociações não rotuladas. Nosso modelo de aprendizado semissupervisionado Aprenda os principais recursos do conjunto de dados rotulados, como tamanho ou frequência da negociação, e usará o conjunto de dados não rotulado para expandir o treinamento.
4) Aprendizagem de representação
Extração e seleção de recursos são um componente-chave de qualquer modelo de machine learning Quant e são particularmente relevantes em problemas que não são muito bem compreendidos, como previsões de Cripto . Imagine que estamos tentando construir um modelo preditivo para o preço do Bitcoin com base em registros do livro de ordens.
Um dos aspectos mais importantes do nosso esforço é determinar quais atributos ou características podem atuar como preditores. É o preço médio, o volume ou uma centena de outros fatores? A abordagem tradicional é confiar em especialistas no assunto para elaborar manualmente essas características, mas isso pode se tornar difícil de escalar e manter ao longo do tempo.
Aprendizado de representação é uma área de aprendizado dep focada em automatizar o aprendizado de representações sólidas ou recursos para construir modelos mais eficazes. Em vez de depender da modelagem de recursos Human , o aprendizado de representação tenta extrapolar recursos diretamente de conjuntos de dados não rotulados. Em nosso exemplo, um método de aprendizado de representação poderia analisar o livro de ordens e identificar centenas de milhares de recursos potenciais que podem atuar como preditores para os preços do Bitcoin . Esse nível de escala e automação é impossível de ser alcançado na engenharia de recursos manual.
5) Busca de arquitetura neural
O processo de criação de modelos de machine learning Quant continua altamente subjetivo em muitos aspectos. Vamos pegar o cenário de um modelo que está tentando prever o preço do Ethereum com base na atividade em um conjunto de protocolos DeFi. Dada a natureza do problema, os cientistas de dados terão certas preferências sobre o tipo de modelo e arquitetura a serem usados.
Em nosso cenário, a maioria dessas ideias seria baseada em conhecimento de domínio e opiniões subjetivas sobre a maneira como a atividade em protocolos DeFi pode impactar o preço do Ethereum. Dado que o aprendizado de máquina é baseado na construção de conhecimento e o conhecimento não é uma unidade discreta, é quase impossível debater os méritos de um método versus outro para um determinado problema.
Busca de arquitetura neural (NAS) é uma área de aprendizado profundo que tenta automatizar os modelos de criação usando aprendizado de máquina. Mais ou menos usando aprendizado de máquina para criar aprendizado de máquina. Dado um problema alvo e conjunto de dados, os métodos NAS avaliarão centenas de possíveis arquiteturas de rede neural e produzirão aquelas com os resultados mais promissores.
Em nosso cenário de amostra, um método NAS pode processar um conjunto de dados que incorpora negociações em bolsas descentralizadas e produzir alguns modelos que podem potencialmente prever o preço do Ethereum com base nesses registros.
Mais por vir
Os métodos descritos acima representam algumas áreas emergentes e mais desenvolvidas de deep learning que provavelmente terão impacto nos modelos Cripto Quant no curto prazo. E essas não são, de forma alguma, as únicas áreas de deep learning às quais o Cripto Quant deve prestar atenção.
Outras disciplinas de aprendizado profundo, como aprendizado por reforço, aprendizado autossupervisionado e até mesmo transformadores, estão rapidamente fazendo incursões no espaço Quant . Pesquisa e experimentação sobre técnicas de aprendizado profundo aplicadas a modelos Quant estão acontecendo em todos os lugares e a Cripto está prestes a ser uma grande beneficiária dessa onda de inovação.
Nota: As opiniões expressas nesta coluna são do autor e não refletem necessariamente as da CoinDesk, Inc. ou de seus proprietários e afiliados.
Jesus Rodriguez
Jesus Rodriguez é o CEO e cofundador da IntoTheBlock, uma plataforma focada em habilitar inteligência de mercado e soluções DeFi institucionais para Mercados de Cripto . Ele também é o cofundador e presidente da Faktory, uma plataforma de IA generativa para aplicativos empresariais e de consumo. Jesus também fundou a The Sequence, uma das Newsletters de IA mais populares do mundo. Além de seu trabalho operacional, Jesus é palestrante convidado na Columbia University e na Wharton Business School e é um escritor e palestrante muito ativo.
