Ocean Protocol:Web3数据经济的工具
1. Ocean工具的网络部署
1.1 初始权限部署
Ocean V1和V2是去中心化且有许可的:
- Ocean智能合约运行在有许可的权威证明(POA)网络上。
- 一小部分人可以在多重签名的设置下升级智能合约。
1.2 基于以太坊主网的无许可部署
从Ocean V3.0版本开始,Ocean是去中心化且无许可的:
- Ocean智能合约部署到以太坊主网这个无许可的网络。
- 合约没有内置的可升级性,因此升级合约的唯一方法是通过社区共识使用一组新的智能合约。
Ocean V3满足了路线图中“V5”无许可的目标。尽管使用以太坊主网,但由于数据代币架构等原因,Ocean V3合约比V1和V2合约更简单,包括大大降低了燃气使用量,购买数据时钱包确认次数也更少。
1.3 通过姐妹链降低燃气成本
DeFi的发展导致以太坊主网使用增加,燃气价格大幅上涨。为了降低成本和提高可扩展性,Ocean V3.x将在另一个网络进行“姐妹”部署,可能是Ocean V3.1。例如xDai Chain,通过任意消息桥(AMB)将OCEAN代币和数据代币连接到以太坊主网。其他可能的选择包括Substrate + EVM部署,或基于汇总的技术如OVM。
姐妹链安全性较低是可以接受的,因为用户可以在更高安全性(以太坊主网)和更低燃气成本(姐妹链,可能安全性较低)之间进行选择。高价值或需要高安全性的数据资产可以继续直接部署到以太坊主网,低价值的数据资产可以先部署到姐妹网络,如果价值足够增加,再“升级”到以太坊主网。
1.4 进一步的网络部署
未来,每个区块链网络都将有一个由Ocean驱动的数据资源权限层,数据代币和OCEAN代币将在各处流动。
Ocean将作为Parity Substrate和Cosmos SDK的附加库,方便波卡和Cosmos区块链家族使用。还可能与第2层汇总(如乐观虚拟机OVM)集成以提高隐私、吞吐量或降低成本。预计会部署到其他基于EVM的网络,如币安智能链、Matic网络等,也会部署到联合网络和非EVM区块链。
在所有这些部署中,OCEAN代币将留在以太坊主网,并通过桥连接到其他网络。OceanDAO或各链的资助机制将鼓励社区进行这些部署,每次部署都会有小额交易费用通过桥流向Ocean社区。
以下是Ocean网络部署的流程图:
graph LR
A[初始权限部署(Ocean V1和V2)] --> B[基于以太坊主网的无许可部署(Ocean V3.0)]
B --> C[通过姐妹链降低燃气成本(Ocean V3.x)]
C --> D[进一步的网络部署]
D --> E[各区块链网络有Ocean权限层]
D --> F[与第2层汇总集成]
D --> G[部署到其他EVM网络]
D --> H[部署到非EVM区块链]
2. Ocean工具的数据市场
2.1 简介
由于每个数据服务都有自己的ERC20代币,任何ERC20交易所都可以作为数据市场,如AMM DEX、订单簿DEX、订单簿CEX等。但针对数据优化的市场可以帮助用户完成整个数据流程,包括发布数据、设定价格、整理数据、发现数据、购买数据和消费数据。
2.2 市场架构
数据市场有多个前端和一个通用的后端(针对给定网络)。前端包括社区市场(Ocean Market)和独立第三方市场。每个前端在浏览器客户端运行,使用Ocean React钩子,通过Ocean JS库与后端交互。
去中心化后端是运行在以太坊主网的Solidity代码,包括数据代币和池合约以及链上元数据存储。当买家在前端购买数据集时,大部分收入归数据卖家,部分费用归流动性提供者、市场运营者和更广泛的社区。
2.3 数据定价
2.3.1 固定定价
一些数据卖家希望以固定价格(固定数量的OCEAN)出售数据。解决方案是使用一个简单的智能合约,一方转移OCEAN,另一方转移数据代币。
2.3.2 通过AMM自动定价
自动发现价格非常有价值。订单簿、拍卖和AMM是可能的方法:
- 订单簿需要买卖双方实时匹配,对于新创建的长尾资产(如数据代币)不可行,但在数据代币有足够流动性和交易者后有用。
- 拍卖在一段时间内进行,对初始定价有用,但不能提供资产整个生命周期的自动价格发现。
- AMM可以自动发现价格,不需要买卖双方实时匹配,适用于初始资产发行和整个资产生命周期。
Ocean的数据代币框架允许使用上述任何方法构建数据交易所,但AMM是最有前途的方法。一个AMM池通常包含特定的数据代币和其他更成熟的代币,如ETH、DAI或OCEAN。以OCEAN为默认选择有助于推动对OCEAN的需求,有利于长期可持续性。
在Ocean基于AMM的数据市场中,数据代币的价格会随着购买(OCEAN兑换更多数据代币)而自动上涨,随着出售(数据代币兑换OCEAN)而下降。
以太坊DeFi领域有很多AMM选项,如Bancor、Uniswap、Balancer等。Ocean Market选择从Balancer开始,原因如下:
- Balancer允许通过单一代币添加流动性,当新的数据代币池发布时,其他人只需添加OCEAN代币即可添加流动性。
- Balancer减轻了发布者的流动性负担,允许池中代币权重不相等,例如数据代币占90%,OCEAN占10%。与50/50的池相比,数据发布者提供相同初始数据代币价格所需的OCEAN流动性只需1/5。未来,Balancer还可以动态改变权重以引导流动性和减轻无常损失。
Ocean对Balancer工厂和池合约进行了调整,使用ERC1167代理模式降低燃气成本。
以下是不同定价方法的比较表格:
| 定价方法 | 优点 | 缺点 | 适用场景 |
| ---- | ---- | ---- | ---- |
| 固定定价 | 简单直接 | 缺乏价格灵活性 | 价格稳定的数据 |
| 订单簿 | 价格发现准确 | 需要实时匹配,不适用于长尾资产 | 流动性充足的资产 |
| 拍卖 | 适用于初始定价 | 不能持续自动发现价格 | 资产初始发行 |
| AMM | 自动发现价格,无需实时匹配 | | 各类数据资产 |
2.4 OCEAN质押和数据整理
AMM需要提供流动性,流动性是池中数据代币和OCEAN的数量。任何人都可以添加流动性,流动性越高,购买时价格变动(滑点)越低。
流动性提供者(LP)进行质押,因为在AMM中质押和提供流动性是等价的。OCEAN质押就是向数据代币 - OCEAN池添加流动性。LP也是数据整理者,因为流动性的数量是数据资产质量的代理。Ocean数据整理就是在数据代币 - OCEAN池中添加/移除流动性。
LP按质押比例获得交易费用分成。这激励整理者整理最有价值的数据集,也激励他们推荐其他人加入他们质押的数据池。Ocean中的数据整理有真实的质量信号,因为需要实际投入流动性。
2.5 Ocean市场操作
2.5.1 发布数据集
用户点击“发布”,填写元数据(标题、描述等),提供数据资产的URL,该URL将被加密存储在链上。填写价格信息(固定或动态),如果是动态价格,添加所需的流动性以符合目标价格。最后点击“发布”,Ocean Market将调用区块链交易部署数据代币合约、在链上发布元数据,并进行所有与AMM相关的交易。
2.5.2 添加/移除流动性
如果数据代币有AMM池,任何用户都可以添加或移除数据代币或OCEAN作为流动性,这也是OCEAN质押和数据整理。
2.5.3 发现数据
Ocean Market有数千个数据资产,支持浏览、搜索和过滤数据资产以帮助发现。
2.5.4 买卖数据集
买家连接钱包(钱包中有OCEAN),点击“购买”按钮,MetaMask弹出确认交易,用OCEAN代币交换数据代币。
2.5.5 消费数据集
数据代币所有者连接钱包,进入拥有资产的子页面,点击“使用”按钮,按照提示下载数据集或获取计算到数据的结果。
2.6 开发者工具和第三方市场
Ocean Market只是一个数据市场,希望有更多的数据市场。开发者使用Ocean JavaScript或Python库,通过1 - 3行JS或PY代码就可以完成以下操作:
- 创建数据资产(提供数据服务、部署数据代币合约、添加元数据、铸造数据代币)。
- 创建AMM市场(或固定价格市场)。
- 添加或移除流动性。
- 交换OCEAN和数据代币。
- 提交数据代币并消费数据资产。
开发者可以通过两种方式构建基于Ocean的数据市场:
- 分叉Ocean Market。
- 直接使用Ocean工具(React钩子、JavaScript库等)构建自己的市场。
2.7 市场中的组限制访问
某些用例需要限制谁可以消费数据,例如只有注册医疗人员可以读取敏感患者数据。可以在以下位置限制访问:
1. 在ERC20合约内部限制,但这会改变ERC20合约规范,不太愿意这样做。
2. 限制对市场的访问,通常是市场设置防火墙,只允许经过验证的账户登录。
3. 限制在市场中的购买能力,即市场维护一个可以购买给定数据资产的以太坊地址白名单。
4. 在消费点限制,提供者运行代码检查人员的凭证,只有代币转移且凭证检查通过才能消费。
建议根据场景选择(2)、(3)和(4)。(2)和(3)不能完全防止不良行为者在市场外获取受限数据代币,但更容易实现;(4)最安全,但提供者需要更多努力。可以使用可验证凭证(VCs)、白名单(通过代币策展注册表TCR或自定义智能合约)或DAO来实现组级访问限制。
2.8 Ocean数据市场的好处
Ocean市场工具使构建和启动数据市场变得容易。基于Ocean的数据市场具有以下特点:
- 互操作性:买卖的数据资产是以太坊主网上的ERC20代币,与更广泛的以太坊生态系统兼容。
- 无需登录:用户只需连接Web3钱包(如MetaMask),买卖数据代币快速便捷。
- 非托管和去中心化:没有集中的中间人控制数据代币,没有单点故障。
- 抗审查,灵活:默认情况下,每个人都可以以相同条件进行交易,也可以设置白名单以满足数据法规或KYC要求。
- 买卖私有数据同时保护隐私:使用Ocean Compute-to-Data,数据不会离开本地。
- 可追溯性:买卖双方可以审计购买交易。
- 货币化:市场可以收取销售佣金,确保数据市场业务可持续发展。
AMM池还具有以下特点:
- 自动价格发现:池中的数据代币价格会根据买卖自动调整。
- 整理(质押 = 提供流动性):提供真实的数据集质量信号。
- 流动性提供者、整理者和质押者可获得交易费用。
- 推荐激励:流动性提供者有动力推荐他们获得交易费用的数据池。
3. Ocean工具的计算到数据(Compute - to - Data)
3.1 动机
私有数据是指个人或组织希望保密的数据,包括个人、医疗、金融等敏感信息。隐私工具旨在实现信息的不对称共享,在确保他人看不到信息的同时,将信息提供给需要的人。
私有数据对研究和创新有很大帮助,能提高现代人工智能模型的预测准确性,是公司的竞争优势。但共享或出售私有数据存在风险,如因隐私信息导致就业受阻或受到迫害,大型组织因担心数据泄露和相关责任而不敢利用数据。
Compute - to - Data的理念是在让数据留在本地的同时,允许第三方在数据上运行特定计算任务,以获得有用的分析结果,如平均值或构建人工智能模型,从而在获取数据价值的同时降低隐私风险。
3.2 概念工作原理
如下图所示,数据科学家Alice在数据市场购买了卖家Bob的私有数据访问权限。她在Bob的私有数据上运行经Bob批准的人工智能建模算法,私下训练模型,模型也由Bob私下存储。然后她在新输入数据上运行训练好的私有模型,得到模型预测结果,这是她唯一能看到的数据。这样Alice得到了想要的预测,Bob也保护了自己的数据隐私。
graph LR
A[数据科学家Alice] --> B[数据市场]
B --> C[卖家Bob的私有数据]
A --> D[运行AI建模算法]
D --> C
C --> E[训练模型]
E --> F[新输入数据]
F --> G[模型预测结果]
A --> G
核心是数据代币,它授予在数据附近运行计算的访问权限,可在市场或其他场景中使用。
3.3 Compute - to - Data的流程变体
3.3.1 模型可下载情况
如果Bob认为模型泄露个人身份信息(PII)的风险较低,如线性模型或小型神经网络,Alice可以下载训练好的模型。
3.3.2 跨数据孤岛学习
Alice可以跨多个数据孤岛学习模型,即“联邦学习”。
3.3.3 非模型训练计算
- 可以在数据附近运行简单的“聚合”函数,如平均值、中位数或简单的一维密度估计,适用于简单的商业智能(BI)用例。
- 可以跨多个数据孤岛计算聚合函数,即“联邦分析”。
- 可以在Bob的数据附近运行合成数据生成算法,Alice下载合成数据进行可视化或训练模型。
- 可以为Bob数据的每个{输入变量,输入值}组合计算哈希值,哈希自然地对数据进行匿名化,Alice下载哈希数据在客户端训练模型,即“解耦哈希”。
- 可以向Bob的数据集添加随机噪声,使数据被认为是匿名的,Alice下载部分随机化的数据在客户端训练模型,这是“差分隐私”的一种变体。
3.4 共享或货币化
Compute - to - Data既适用于科学或技术领域的数据共享,也适用于在保护隐私的同时货币化私有数据。私有数据不是直接出售,而是出售特定的访问权限,即“仅供计算使用”的访问权限。因此,数据市场中的Compute - to - Data为公司提供了货币化其数据资产的机会。
3.5 Compute - to - Data架构
3.5.1 新参与者
Ocean协议原有的参与者包括数据提供者、数据消费者和市场,Compute - to - Data增加了计算提供者,计算提供者出售数据上的计算服务,而不是数据本身。
3.5.2 新组件
- 操作员服务(Operator Service):一个微服务,负责管理工作流程和执行请求。它直接与提供者(数据提供者的代理服务器)通信并接收命令,对提供者提供的数据进行计算。
- 操作员引擎(Operator Engine):一个后端服务,负责使用Kubernetes作为后端编排计算基础设施。通常,操作员引擎从Kubernetes中检索操作员服务创建的工作流程,并管理完成计算工作流程执行所需的基础设施。
3.5.3 新资产类型
之前,数据集是元数据(DDO)中唯一的资产类型。Compute - to - Data引入了新的资产类型——算法,它是可以在数据集上执行的脚本。
3.6 市场和Compute - to - Data
市场可以允许用户发布启用Compute - to - Data的数据集,有些市场甚至可能要求这样做。市场可以选择向最终用户提供哪些具体的计算资源,包括在Kubernetes集群中选择不同的镜像和资源。同样,市场可以选择和限制允许用户在市场数据集中运行的算法类型。
3.7 信任算法
只需要在一个狭窄的方面信任算法:算法是否有可忽略不计的PII泄露风险。例如,简单的平均函数可以充分聚合数据以避免泄露PII,人工智能算法也能聚合信息。
数据所有者通常选择信任哪些算法,这是他们的判断。他们可能会检查代码,在沙箱中运行以查看其依赖项、通信和使用的资源。
以下是Compute - to - Data涉及的新元素总结表格:
| 新元素类型 | 具体内容 | 说明 |
| ---- | ---- | ---- |
| 新参与者 | 计算提供者 | 出售数据上的计算服务 |
| 新组件 | 操作员服务 | 管理工作流程和执行请求 |
| | 操作员引擎 | 编排计算基础设施 |
| 新资产类型 | 算法 | 可在数据集上执行的脚本 |
Ocean Protocol构建Web3数据经济
超级会员免费看
20

被折叠的 条评论
为什么被折叠?



