个人数据已经成为互联网经济的基石。在过去的二十年里,我们接受了一个简单的交易模式:平台通过提供免费服务来收集用户数据并将其变现。这个模式——「如果你没有付费,那你就是商品」——塑造了从定向广告到数据经纪人等各类商业形态。
AI 的崛起使得局面变得更加复杂。平台现在以数亿美元的价格出售用户数据,用于训练 AI 模型——将个人信息从定向广告的资源转变为人工智能的核心构建要素。然而,创造这些数据的用户却未能从中获得相应的价值。
这并非初衷。互联网设计者原本设想由用户而非平台控制个人信息。Tim Berners-Lee 花了多年时间致力于恢复这种数据主权。然而,云基础设施的便捷性和免费服务的普及最终占据了主导地位,平台因此成为了我们数字世界的掌控者。
如今,两个变革性转变汇聚在一起:AI 让个人数据的价值呈指数级增长,而去中心化技术的进步则最终赋予了个人掌控数据的工具。
Vana 是首个开源的数据主权协议。它允许用户从平台导出自己的数据,并加入数据集体,直接与 AI 公司和开发者进行谈判。通过加密的个人存储和客户端计算,用户在掌控自己数据的同时,实现了以往只有通过中心化平台才能获得的网络效应。它提供了一个自我主权的互联网,双方均可受益:开发者能够利用理想的数据集构建变革性应用,用户则完全掌控自己的最宝贵资产。
今天,我们在主网发布前推出了Vana 白皮书。在这篇文章中,我们将探讨 Vana 如何将个人数据从一种被提取的资源转变为由创作者控制的资产类别。
克服数据双花的问题
与其他数字资产不同,将数据金融化的核心挑战在于,数据的经济价值依赖于对访问的权限——一旦数据公开,它便失去了市场价值。传统区块链侧重于公开可验证性,这使得它们并不适合用来处理私人数据。Vana 通过一种将私人数据托管与公共所有权相结合的架构解决了这个问题。
Vana 网络维持一个全球状态,包含以下内容:
· 数据所有权记录:数据拥有的密码学证明
· 访问权限:谁可以在什么条件下访问哪些数据
· 验证证明:数据质量、真实性和元数据的认证
· 链上数据集体合同和代币余额:经济权利和治理
尽管数据依然加密存储在个人服务器或安全隔离区中,网络通过程序化控制使用户能够决定谁可以访问数据、在何种条件下访问,以及如何将价值回馈给数据创作者。
在实际操作中,用户可以将自己的私人数据从任何平台导出,并存储在由加密密钥保护的个人服务器中,随后加入 Vana 上的数据集体,这些集体将相似类别的用户数据汇集在一起。这些数据集体被称为 DataDAO,它们可以用与 AI 模型训练研究人员或应用开发者进行谈判,商定支付数据使用费用。当外部开发者购买数据时,数据池的数据贡献者将获得相应的报酬。
DataDAOs 和数据代币
数据流动性池是一种协调机制,将个人数据转化为新的资产类别,通过将不可替代的数据映射为可替代的数据代币。它通过智能合约实例化 DataDAO,DataDAO 代表着围绕特定数据生态系统的贡献者、开发者和研究人员。当用户贡献数据时,他们根据 DataDAO 的贡献证明(Proof of Contribution)获得特定的 DLP 代币。
每个 DataDAO 根据数据类型设置不同的贡献证明标准。例如,金融数据 DLP 可能注重交易准确性、记录完整性,而社交媒体 DLP 则关注用户互动和账户寿命。健康数据 DLP 则重视数据实效性和设备准确性。
Vana 协议提供标准化认证架构,将数据证明和元数据链上存储,同时保护数据隐私。数据验证通过 Satya 网络中的可信执行环境(TEEs)进行,确保数据质量认证的同时保护隐私。一些 DLP 还使用 zk 技术来增强数据验证,包括 zk 电子邮件和 zktls。
DLP 作为 Vana 网络中集体数据资产的核心协调机制,与传统的 DeFi 流动性池不同,后者协调的是可替代的代币对,而 DLP 则协调不可替代的个人贡献数据,同时保持数据隐私和数据主权。
Vana 基金会目前与 12 个优质 DataDAO 合作,开展加速器计划,并已收到 300 个新的申请。当前的 DataDAO 团队由 2 到 5 人组成,专职致力于围绕特定数据源建立 DLP,包括 Twitter 数据、合成数据、基因数据和浏览器数据等。每个 DataDAO 都会发行自己的数据集专属代币。用户可以在这里了解更多关于DataDAO 的信息。
DLP 的优势在于它们的无需许可性质——任何人都可以创建 DLP,而无需获得数据来源平台的批准。这是因为 DLP 利用现有的数据隐私法规,保障个人用户所有权导出和控制自己的个人数据。
当 AI 研究人员和模型开发者希望访问这些汇总数据时,他们可以直接与 DataDAO 的治理系统进行互动,而不是与成千上万的个人用户进行谈判。这种集体谈判的方式具有变革意义:数据贡献者根据他们的贡献获得治理代币,赋予他们经济权利和决策权,决定如何使用他们的数据。最终结果是一个良性循环,其中高质量的数据贡献得到奖励,市场力量决定公平的访问定价,并激励持续贡献数据的用户。
例如,一位 AI 研究人员可能向 DataDAO 提出分阶段的访问计划,先访问数据集的 10% 进行质量控制,再使用完整数据集进行模型训练——所有数据保持加密和安全。作为交换,他们将销毁一定数量的 DLP 代币,将价值分配给数据贡献者。这样,数据集的价值增长时,收益会直接回馈给贡献者。
DataDAOs 与 VANA 代币
Vana 主网的启动将打破大科技公司对数据的垄断。过去,AI 公司只能与像 Meta 和 Google 这样的中心化平台合作,这些平台控制着大量数据,限制了开发者的访问。而这种局面一直存在,因为协调数百万个用户的数据访问是个技术性和社会的挑战。
Vana 主网通过建立数据主权基础设施,彻底改变了这一格局。数百万用户可以将数据汇集成一个流动性市场,既能与大科技公司竞争,又能加密保护个人信息。Vana 主网打造了一个由市场力量主导的数据经济,而非平台垄断。
我们为用户数据的所有权奠定了基础:用户通过非托管钱包控制,且数据可随他们在互联网上的活动携带。
VANA 代币通过几个关键功能实现这一愿景:
· 通过验证者质押来保证网络安全
· 为网络操作支付交易费用
· DLP 质押,决定不同 DataDAO 的发放奖励
· 用于购买所有 DLP 的数据访问权限
AI 公司想要访问 DLP 数据时,必须使用 VANA 购买并销毁 DLP 代币。这在网络使用和代币价值之间建立了直接的经济联系。随着越来越多的 AI 公司需要访问用户数据,推动了对 VANA 和 DLP 代币的需求。销毁机制确保了价值回馈给网络和数据贡献者。
排名前 16 的 DataDAO 将根据 VANA 代币的持有量获得奖励,以奖励那些早期为网络贡献数据的用户。每 3 周选出前 16 名,并按 Vana DAO 的绩效指标分配奖励。更多关于 DataDAO 奖励的信息请点击查看此处。
通过这种方式,VANA 既是数据交易的经济基础,又代表了网络中数据资产的总价值。随着更多 AI 公司访问 DLP 数据,VANA 的购买和销毁机制创造了一个可持续的经济体系,奖励数据贡献者和网络参与者。
数据经济开放的新时代
Vana 主网的启动标志着 AI 经济中权力的根本转变。用户可以共同挑战大科技公司的数据垄断,将个人数据转变为自己掌控的资产。这不仅是为了可以得到奖励,更是重新定义谁在构建、控制和受益于 AI。
这个机会既迫切又巨大。AI 公司正面临数据瓶颈,急需新的训练数据。通过 Vana,用户可以将数据汇聚成可与大平台竞争的数据集,同时保持加密控制。随着每个新用户加入,Vana 网络变得更强大,支持跨平台的数据集并赋予用户数据主权。
我们正在构建一个为用户和开源开发者服务的 AI 经济,而非 Web2 巨头。在这个时代,数据自由流动,主权保持绝对,下一代 AI 模型将在用户拥有的数据上进行训练,利益回馈给数据贡献者,顶级 AI 开发者可以访问理想的数据集。加入我们,共同打造一个新的开放数据经济。