Compartir este artículo

Anna Kazlauskas: La propiedad de los datos en la era de la IA

La cofundadora de Vana está desarrollando DAOs de datos y mercados descentralizados para crear un ecosistema de datos propiedad de los usuarios. Dará la charla principal en la Cumbre de IA de Consensus el 16 de mayo.

Kazlauskas

Estás inundado de datos. Creas nuevos datos cada día. ¿Si tu app de salud cuenta tus pasos? Esos son datos nuevos. ¿El anillo Oura que registra tus datos biométricos? Datos valiosos. ¿Tus publicaciones en redes sociales, incluso los chistes tontos que no tuvieron ni un solo "me gusta"? Más datos.

Todos estos son datos que a las empresas de IA les encantaría recopilar. No se puede desarrollar una buena IA sin buenos datos, por lo que muchos los consideran el "nuevo petróleo" en la carrera por la IA. El problema, sin embargo, es que, si bien sus datos son valiosos... en teoríaLa realidad es que es difícil monetizar tus datos personales, ya que no tienes influencia como individuo. (Open AI no te está llamando a la puerta para comprar tus tuits antiguos).

CONTINÚA MÁS ABAJO
No te pierdas otra historia.Suscríbete al boletín de Crypto Daybook Americas hoy. Ver Todos Los Boletines

Ingresar Vana“Creo que los datos son un recurso fundamental que impulsa la próxima generación de IA y, en realidad, la próxima generación de nuestra economía digital”, afirma Anna Kazlauskas, cofundadora de Vana y directora ejecutiva de Open Data Labs. “Francamente, mucha gente simplemente no se da cuenta de que sus datos son realmente suyos”.

Pero sí eres dueño de tus datos. Y son valiosos… si logras unir fuerzas con millones de personas que también poseen sus datos. Esto te daría poder de negociación. Y esa es la misión de Vana: crear un ecosistema para datos propiedad de los usuarios, que a su vez impulse la IA propiedad de los usuarios.

Ese ecosistema implica una combinación de DAO de datos (una “unión laboral” de datos), mercados de datos descentralizados, el recientemente lanzadoToken VRC-20, y una nuevacolaboracióncon Flower Labs para construir el primer modelo fundacional propiedad del usuario del mundo. (Anexo A: La IA descentralizada se está convirtiendo en algo común: La colaboración Vana/Flower fue cubierta porCON CABLE.)

Kazlauskas dará una conferencia magistral en elCumbre de IA en Consensus 2025Delineando esta visión, y aquí da un vistazo. Y ve que el impulso está cambiando. "Ya estamos empezando a ver este cambio: cada vez más personas se dan cuenta de que 'Mis datos son realmente importantes para la IA' y 'Soy el propietario de ellos'". Predice que en unos años, más de 100 millones de usuarios se unirán. ¿En 10 años? "Población mundial. Más de 10 mil millones".

La entrevista ha sido condensada y ligeramente editada para mayor claridad.

¿Por qué son tan importantes para usted los datos propiedad de los usuarios?

Anna Kazlauskas: Mucha gente asume que los datos pertenecen a las plataformas donde se almacenan, pero no es así. De la misma manera que cuando aparcas tu coche, el aparcamiento no es el propietario. Siempre puedes recuperarlo. Tienes plena propiedad sobre él.

Hoy en día, se generan enormes ingresos, principalmente gracias a las grandes empresas tecnológicas, gracias a esos datos, pero los usuarios son los propietarios legales. Por eso, creo que es importante recuperar esa propiedad, tanto desde la perspectiva del usuario como desde la del desarrollador.

¿Puedes conectar los puntos para ver cómo esto ayuda a los desarrolladores?

Como desarrollador, especialmente en el mundo de la IA, tener acceso a los datos correctos es fundamental. Y es muy difícil ahora mismo, porque la mayoría de los datos están encerrados en los jardines amurallados de las grandes tecnológicas. Muchos de mis amigos más inteligentes que trabajan en IA trabajan en grandes laboratorios, porque ahí es donde están los datos y la computación. Pero eso no tiene por qué ser así.

¿Cómo encajan exactamente las DAO de datos en esta visión?

Un DataDAO es como un sindicato de datos. Básicamente, un gran grupo de personas reúne sus datos y toma decisiones colectivas sobre su uso.

La razón por la que esto es importante es que los datos, por sí solos, no son tan útiles, ¿verdad? Son mucho más útiles cuando hay una gran cantidad, cuando hay suficiente para entrenar un modelo de IA.

¿Cuáles son algunas de las DAO de datos que más te entusiasman?

Hay algunos en el sector de la salud que son realmente interesantes. Hay ONE en sus inicios que está exportando historiales médicos completos de pacientes, lo que creo que puede impulsar la investigación en este campo. Hay algunos relacionados con la biometría, el sueño y la salud. Hay ONE con los laboratorios DLP [Programa de Fidelización de Conductores]; están recopilando datos de automóviles. Y dentro de su conjunto de datos, los datos de Tesla son realmente interesantes porque la mayoría de la gente considera a Tesla valioso porque tienen una ventaja en la gestión de datos, ¿verdad? De hecho, los usuarios pueden acceder a una gran cantidad de ese conjunto de datos.

Estás pasando de la teoría a la práctica con la nueva colaboración con Flower Labs para construir COLLECTIVE-1. ¿Cuál es el objetivo?

COLLECTIVE-1 es el primer modelo de base propiedad del usuario. Normalmente, cuando pensamos en un modelo de base, pensamos en una empresa que ejecuta un trabajo de capacitación muy grande en un solo centro de datos, ¿verdad? Como OpenAI. Y la razón por la que suele realizarse de forma centralizada es porque requiere, ONE, una gran capacidad de procesamiento y, segundo, una gran cantidad de datos.

Flower AI es prácticamente líder en entrenamiento federado [descentralizado]. Han hecho un excelente trabajo creando estas excelentes bibliotecas de código abierto. Han trabajado tanto en el entrenamiento como en el algoritmo. Y con Vana, nos centramos en los datos, ¿verdad? Básicamente, tenemos todos estos datos con los que se puede entrenar. Luego, se otorga a los usuarios la propiedad final del modelo, y estos pueden decidir qué puede hacer el modelo. Este es el primer modelo base de este tipo.

Y la teoría es que, eventualmente, con mejores datos, se puede construir una IA que no sea solo...competitivo con los jugadores centrales peromejor¿Es cierto? Entonces no se trata solo de ideología, sino también de rendimiento.

Exactamente, sí, es totalmente cierto. Desde un contexto descentralizado, creo que a menudo la gente coincide en principio en que: «Sí, deberíamos tener una IA controlada por la gente. Deberíamos tener una IA descentralizada». Pero ¿qué podemos mejorar realmente en un contexto descentralizado? Los datos son la respuesta. Cada empresa solo tiene su propia porción de un conjunto de datos. Apple tiene sus datos. Google tiene los suyos. Pero si se analiza al usuario, se puede conectar a diferentes plataformas y, de hecho, crear conjuntos de datos mejores que cualquier empresa por sí sola. Los datos son la Secret para que todo funcione.

Me encanta. Gracias, Anna. Nos vemos en la Cumbre de IA en Toronto.

Jeff Wilser será el anfitrión de la Cumbre de IA en Consensus 2025 y es anfitrión deLa IA del Pueblo: El podcast de IA descentralizada.


Jeff Wilser

Jeff Wilser is the author of 7 books including Alexander Hamilton's Guide to Life, The Book of Joe: The Life, Wit, and (Sometimes Accidental) Wisdom of Joe Biden, and an Amazon Best Book of the Month in both Non-Fiction and Humor.

Jeff is a freelance journalist and content marketing writer with over 13 years of experience. His work has been published by The New York Times, New York magazine, Fast Company, GQ, Esquire, TIME, Conde Nast Traveler, Glamour, Cosmo, mental_floss, MTV, Los Angeles Times, Chicago Tribune, The Miami Herald, and Comstock's Magazine. He covers a wide range of topics including travel, tech, business, history, dating and relationships, books, culture, blockchain, film, finance, productivity, psychology, and specializes in translating "geek to plain-talk." His TV appearances have ranged from BBC News to the The View.

Jeff also has a strong business background. He began his career as a financial analyst for Intel Corporation, and spent 10 years providing data analysis and customer segmentation insights for a $200 million division of Scholastic Publishing. This makes him a good fit for corporate and business clients. His corporate clients range from Reebok to Kimpton Hotels to AARP.

Jeff is represented by Rob Weisbach Creative Management.

Jeff Wilser