Partager cet article

Le problème des données de la blockchain pourrait être plus important que vous ne le pensez

Certains points de données Bitcoin semblent assez faciles à mesurer, mais attention, ces chiffres sont plus nuancés que vous ne le pensez.

Un point de données simple : l’offre totale de Bitcoin a atteint 17 millions.

Mais comme pour la plupart des choses dans le Crypto, ce n’était T si simple.

La Suite Ci-Dessous
Ne manquez pas une autre histoire.Abonnez vous à la newsletter Crypto Long & Short aujourd. Voir Toutes les Newsletters

Toutes les 10 minutes environ, les mineurs trouvent un bloc de transactions et le réseau ajoute 12,5 nouveaux Bitcoin à l'offre totale en guise de récompense pour les mineurs. Chaque récompense est enregistrée sur la blockchain depuis le lancement du Bitcoin début 2009.

En tant que tel, cela ressemblait à un nombre –une étape importante– l’industrie pouvait avoir confiance.

Mais alors que certains célébraient une fois que la cible avait été atteinte sur le site Web du fournisseur de données Bitcoin Blockchain, d'autres se sont tournés vers Twitter pour gâcher leur fête.

Jameson Lopp, ingénieur Casa et créateur de Statoshi.info, un autre site de données Bitcoin accessible au public, tweeté:

« J'ai appris aujourd'hui que de nombreuses sources de données rapportent de manière erronée l'offre totale de Bitcoin . Nous n'avons T encore atteint les 17 millions de BTC . »

L'argument de Lopp était que Blockchain.info, ONEune des sources les plus populaires et les plus réputées pour les données du réseau blockchain, entre autres, n'avait pas pris en compte les cas dans lesquels les mineurs de Bitcoin , en raison de bugs et d'autres causes, n'a pas prétenduleur récompense de bloc complet.

Malheureusement, ces écarts dans la mesure de l'offre totale de Bitcoin ne sont pas l'exception, mais font partie d'un problème plus vaste qui découle des méthodologies « opaques » utilisées par ces fournisseurs d'analyse de données blockchain, selon Greg Cipolaro, PDG de Digital Asset Research (DAR), une entreprise qui fournit des analyses blockchain à ses clients.

En tant que tel, DAR s'est donné pour mission de comprendre les méthodes de la Blockchain pour ce qu'il appelle «ONEun des mystères les plus anciens de la communauté des Cryptomonnaie » : le bitcoin. valeur estimée de la transaction. Dans le rapport de l'entreprise sur le sujet,publié récemment, DAR a déclaré que Blockchain avait surestimé les valeurs des transactions d'octobre à février 2017 et les avait largement sous-estimées depuis lors.

Les dirigeants de Blockchain n'étaient pas disponibles pour une interview avant l'heure de mise sous presse.

Mais ce n'est pas seulement la blockchain. Cipolaro a cité la suppression en janvier par CoinMarketCap (sans avertissement) deDonnées de change sud-coréennes de son indice de prix. Étant donné que les prix des Cryptomonnaie sur les plateformes d'échange sud-coréennes ont tendance à être plus élevés, cette éviction a donné l'impression que les Marchés des Crypto s'effondraient.

Des ventes paniques ont suivi, déclenchant ce que Cipolaro a appelé « un mini-krach éclair ».

En toute honnêteté, les Indices de prix reposent toujours sur des décisions subjectives. Cela est vrai non seulement pour les cryptomonnaies, mais aussi pour le marché boursier. Or, sans une compréhension approfondie de la manière dont les prix et autres indicateurs sont calculés, la communauté des Cryptomonnaie pourrait en pâtir. Des données précises sont essentielles pour les investisseurs, les traders, les utilisateurs, les développeurs, les universitaires, les journalistes – bref, pour tout le monde.

Un problème multicouche

Pourtant, de nombreuses personnes qui dépendent des données de la blockchain publique ne réalisent T à quel point certaines de ces données sont erronées.

Offrant une perspective sombre sur l'état général de l'analyse de la blockchain aujourd'hui, Stefan Richter, un informaticien qui a cofondé le fournisseur de données BitcoinPrivacy, a déclaré à CoinDesk:

« Il y a bien sûr des bugs logiciels dans probablement tous les explorateurs. »

Et Cipolaro a fait écho à cela en disant : « Ce n’est pas quelque chose que vous remarqueriez à moins de passer vos journées à le regarder. »

Heureusement, certains passionnés de l’industrie l’ont remarqué.

Lopp, pour ONE, est un passionné de données sur les Cryptomonnaie . Il a souligné que le nombre de nœuds Bitcoin , un chiffre souvent cité comme indicateur de la décentralisation et de la santé du réseau, était une mesure particulièrement précise.

« J'entends souvent dire qu'il n'y a que 10 000 nœuds Bitcoin », a déclaré Lopp. Mais la source de ce chiffre… Bitnodes, "ne compte que les nœuds accessibles qui acceptent les connexions entrantes."

Addy Yeow, le créateur de Bitnodes, a confirmé que le site ne compte que les nœuds « d'écoute ».

Ainsi, le nombre total de nœuds pourrait être bien plus élevé, selon Lopp. En effet,une estimationplace les nœuds d'écoute et de non-écoute à près de 140 000.

Bien que Yeow soit d'accord, il prévient que l'ajout de nœuds non à l'écoute à la métrique nécessiterait des hypothèses majeures. Il explique que les sources de données qui comptabilisent les nœuds non à l'écoute se livrent en réalité à un jeu de devinettes. Les nœuds T à l'écoute pourraient rester connectés, mais derrière un pare-feu, par exemple. Ils pourraient également avoir changé d'adresse IP, voire être complètement déconnectés.

Les fournisseurs d'analyse qui prennent en compte les nœuds non à l'écoute utilisent une formule qui prend en compte le nombre de jours pendant lesquels les nœuds n'ont pas écouté afin de les compter, mais plus ils capturent de nœuds invisibles mais connectés, plus ils incluent de nœuds déconnectés par erreur.

Comment s'y rendre

En raison des problèmes liés aux ensembles de données publics, de nombreux professionnels des données blockchain évitent de les utiliser et utilisent plutôt des données qu'ils calculent en interne chaque fois que cela est possible.

Chainalysis, une entreprise qui analyse les données blockchain pour des clients comme l'Internal Revenue Service (IRS) des États-Unis, est assurément sceptique. Kimberley Grauer, économiste en chef de Chainalysis, a déclaré préférer utiliser les données internes car « je connais les erreurs et les vulnérabilités ». Cipolaro, de DAR, a confirmé cette affirmation, expliquant à CoinDesk que l'entreprise exploite son propre code, collectant les données de son propre nœud Bitcoin .

Malgré leurs défauts, Cipolaro fait l’éloge des sites gratuits qui mettent les données Bitcoin à la disposition du public.

« Ils constituent une bonne source d’informations de haute qualité », a-t-il déclaré.

Et il est évident que ces entreprises essaient.  Lorsqu'unbogue Le service Web de Blockchain a fait apparaître (à tort) que le fondateur de Bitcoin, Satoshi Nakamoto, avait déplacé certaines pièces, a déclaré la société. fixéle problème.

Certains problèmes devraient être faciles à résoudre. Grauer a souligné que les explorateurs de blocs négligent souvent de noter les fuseaux horaires et qu'ils T pas tous le ONE. Bien que ce ne soit pas totalement faux, cela prête à confusion.

« Comparez simplement blockchain.info à BTC! » a déclaré Grauer. (Nous l'avons fait : le bloc 520672 a été miné à 23h18 le30 avrilou 03:18 sur1er mai. Il n'y a aucune indication du fuseau horaire utilisé par l'un ou l'autre site.)

D'autres ensembles de données ne seront T aussi faciles à nettoyer. Bien que la blockchain Bitcoin soit entièrement publique, manière compliquée La manière dont les transactions sont effectuées rend la mesure de leur valeur parfois complexe. Même la DAR ne prétend pas que sa nouvelle méthode soit parfaitement précise.

« Ce ne sera probablement pas la dernière amélioration que nous apporterons », a déclaré la société dans son rapport.

Pour le moment, la communauté devra se souvenir du vieux proverbe russe, réutilisé par les cypherpunks :

« Ne T confiance, vérifiez. »

Bingoimage via Shutterstock

Picture of CoinDesk author David Floyd