57、Ocean Protocol:Web3数据经济的工具

Ocean Protocol构建Web3数据经济

Ocean Protocol:Web3数据经济的工具

1. Ocean工具的网络部署

1.1 初始权限部署

Ocean V1和V2是去中心化且有许可的:
- Ocean智能合约运行在有许可的权威证明(POA)网络上。
- 一小部分人可以在多重签名的设置下升级智能合约。

1.2 基于以太坊主网的无许可部署

从Ocean V3.0版本开始,Ocean是去中心化且无许可的:
- Ocean智能合约部署到以太坊主网这个无许可的网络。
- 合约没有内置的可升级性,因此升级合约的唯一方法是通过社区共识使用一组新的智能合约。

Ocean V3满足了路线图中“V5”无许可的目标。尽管使用以太坊主网,但由于数据代币架构等原因,Ocean V3合约比V1和V2合约更简单,包括大大降低了燃气使用量,购买数据时钱包确认次数也更少。

1.3 通过姐妹链降低燃气成本

DeFi的发展导致以太坊主网使用增加,燃气价格大幅上涨。为了降低成本和提高可扩展性,Ocean V3.x将在另一个网络进行“姐妹”部署,可能是Ocean V3.1。例如xDai Chain,通过任意消息桥(AMB)将OCEAN代币和数据代币连接到以太坊主网。其他可能的选择包括Substrate + EVM部署,或基于汇总的技术如OVM。

姐妹链安全性较低是可以接受的,因为用户可以在更高安全性(以太坊主网)和更低燃气成本(姐妹链,可能安全性较低)之间进行选择。高价值或需要高安全性的数据资产可以继续直接部署到以太坊主网,低价值的数据资产可以先部署到姐妹网络,如果价值足够增加,再“升级”到以太坊主网。

1.4 进一步的网络部署

未来,每个区块链网络都将有一个由Ocean驱动的数据资源权限层,数据代币和OCEAN代币将在各处流动。

Ocean将作为Parity Substrate和Cosmos SDK的附加库,方便波卡和Cosmos区块链家族使用。还可能与第2层汇总(如乐观虚拟机OVM)集成以提高隐私、吞吐量或降低成本。预计会部署到其他基于EVM的网络,如币安智能链、Matic网络等,也会部署到联合网络和非EVM区块链。

在所有这些部署中,OCEAN代币将留在以太坊主网,并通过桥连接到其他网络。OceanDAO或各链的资助机制将鼓励社区进行这些部署,每次部署都会有小额交易费用通过桥流向Ocean社区。

以下是Ocean网络部署的流程图:

graph LR
    A[初始权限部署(Ocean V1和V2)] --> B[基于以太坊主网的无许可部署(Ocean V3.0)]
    B --> C[通过姐妹链降低燃气成本(Ocean V3.x)]
    C --> D[进一步的网络部署]
    D --> E[各区块链网络有Ocean权限层]
    D --> F[与第2层汇总集成]
    D --> G[部署到其他EVM网络]
    D --> H[部署到非EVM区块链]

2. Ocean工具的数据市场

2.1 简介

由于每个数据服务都有自己的ERC20代币,任何ERC20交易所都可以作为数据市场,如AMM DEX、订单簿DEX、订单簿CEX等。但针对数据优化的市场可以帮助用户完成整个数据流程,包括发布数据、设定价格、整理数据、发现数据、购买数据和消费数据。

2.2 市场架构

数据市场有多个前端和一个通用的后端(针对给定网络)。前端包括社区市场(Ocean Market)和独立第三方市场。每个前端在浏览器客户端运行,使用Ocean React钩子,通过Ocean JS库与后端交互。

去中心化后端是运行在以太坊主网的Solidity代码,包括数据代币和池合约以及链上元数据存储。当买家在前端购买数据集时,大部分收入归数据卖家,部分费用归流动性提供者、市场运营者和更广泛的社区。

2.3 数据定价

2.3.1 固定定价

一些数据卖家希望以固定价格(固定数量的OCEAN)出售数据。解决方案是使用一个简单的智能合约,一方转移OCEAN,另一方转移数据代币。

2.3.2 通过AMM自动定价

自动发现价格非常有价值。订单簿、拍卖和AMM是可能的方法:
- 订单簿需要买卖双方实时匹配,对于新创建的长尾资产(如数据代币)不可行,但在数据代币有足够流动性和交易者后有用。
- 拍卖在一段时间内进行,对初始定价有用,但不能提供资产整个生命周期的自动价格发现。
- AMM可以自动发现价格,不需要买卖双方实时匹配,适用于初始资产发行和整个资产生命周期。

Ocean的数据代币框架允许使用上述任何方法构建数据交易所,但AMM是最有前途的方法。一个AMM池通常包含特定的数据代币和其他更成熟的代币,如ETH、DAI或OCEAN。以OCEAN为默认选择有助于推动对OCEAN的需求,有利于长期可持续性。

在Ocean基于AMM的数据市场中,数据代币的价格会随着购买(OCEAN兑换更多数据代币)而自动上涨,随着出售(数据代币兑换OCEAN)而下降。

以太坊DeFi领域有很多AMM选项,如Bancor、Uniswap、Balancer等。Ocean Market选择从Balancer开始,原因如下:
- Balancer允许通过单一代币添加流动性,当新的数据代币池发布时,其他人只需添加OCEAN代币即可添加流动性。
- Balancer减轻了发布者的流动性负担,允许池中代币权重不相等,例如数据代币占90%,OCEAN占10%。与50/50的池相比,数据发布者提供相同初始数据代币价格所需的OCEAN流动性只需1/5。未来,Balancer还可以动态改变权重以引导流动性和减轻无常损失。

Ocean对Balancer工厂和池合约进行了调整,使用ERC1167代理模式降低燃气成本。

以下是不同定价方法的比较表格:
| 定价方法 | 优点 | 缺点 | 适用场景 |
| ---- | ---- | ---- | ---- |
| 固定定价 | 简单直接 | 缺乏价格灵活性 | 价格稳定的数据 |
| 订单簿 | 价格发现准确 | 需要实时匹配,不适用于长尾资产 | 流动性充足的资产 |
| 拍卖 | 适用于初始定价 | 不能持续自动发现价格 | 资产初始发行 |
| AMM | 自动发现价格,无需实时匹配 | | 各类数据资产 |

2.4 OCEAN质押和数据整理

AMM需要提供流动性,流动性是池中数据代币和OCEAN的数量。任何人都可以添加流动性,流动性越高,购买时价格变动(滑点)越低。

流动性提供者(LP)进行质押,因为在AMM中质押和提供流动性是等价的。OCEAN质押就是向数据代币 - OCEAN池添加流动性。LP也是数据整理者,因为流动性的数量是数据资产质量的代理。Ocean数据整理就是在数据代币 - OCEAN池中添加/移除流动性。

LP按质押比例获得交易费用分成。这激励整理者整理最有价值的数据集,也激励他们推荐其他人加入他们质押的数据池。Ocean中的数据整理有真实的质量信号,因为需要实际投入流动性。

2.5 Ocean市场操作

2.5.1 发布数据集

用户点击“发布”,填写元数据(标题、描述等),提供数据资产的URL,该URL将被加密存储在链上。填写价格信息(固定或动态),如果是动态价格,添加所需的流动性以符合目标价格。最后点击“发布”,Ocean Market将调用区块链交易部署数据代币合约、在链上发布元数据,并进行所有与AMM相关的交易。

2.5.2 添加/移除流动性

如果数据代币有AMM池,任何用户都可以添加或移除数据代币或OCEAN作为流动性,这也是OCEAN质押和数据整理。

2.5.3 发现数据

Ocean Market有数千个数据资产,支持浏览、搜索和过滤数据资产以帮助发现。

2.5.4 买卖数据集

买家连接钱包(钱包中有OCEAN),点击“购买”按钮,MetaMask弹出确认交易,用OCEAN代币交换数据代币。

2.5.5 消费数据集

数据代币所有者连接钱包,进入拥有资产的子页面,点击“使用”按钮,按照提示下载数据集或获取计算到数据的结果。

2.6 开发者工具和第三方市场

Ocean Market只是一个数据市场,希望有更多的数据市场。开发者使用Ocean JavaScript或Python库,通过1 - 3行JS或PY代码就可以完成以下操作:
- 创建数据资产(提供数据服务、部署数据代币合约、添加元数据、铸造数据代币)。
- 创建AMM市场(或固定价格市场)。
- 添加或移除流动性。
- 交换OCEAN和数据代币。
- 提交数据代币并消费数据资产。

开发者可以通过两种方式构建基于Ocean的数据市场:
- 分叉Ocean Market。
- 直接使用Ocean工具(React钩子、JavaScript库等)构建自己的市场。

2.7 市场中的组限制访问

某些用例需要限制谁可以消费数据,例如只有注册医疗人员可以读取敏感患者数据。可以在以下位置限制访问:
1. 在ERC20合约内部限制,但这会改变ERC20合约规范,不太愿意这样做。
2. 限制对市场的访问,通常是市场设置防火墙,只允许经过验证的账户登录。
3. 限制在市场中的购买能力,即市场维护一个可以购买给定数据资产的以太坊地址白名单。
4. 在消费点限制,提供者运行代码检查人员的凭证,只有代币转移且凭证检查通过才能消费。

建议根据场景选择(2)、(3)和(4)。(2)和(3)不能完全防止不良行为者在市场外获取受限数据代币,但更容易实现;(4)最安全,但提供者需要更多努力。可以使用可验证凭证(VCs)、白名单(通过代币策展注册表TCR或自定义智能合约)或DAO来实现组级访问限制。

2.8 Ocean数据市场的好处

Ocean市场工具使构建和启动数据市场变得容易。基于Ocean的数据市场具有以下特点:
- 互操作性:买卖的数据资产是以太坊主网上的ERC20代币,与更广泛的以太坊生态系统兼容。
- 无需登录:用户只需连接Web3钱包(如MetaMask),买卖数据代币快速便捷。
- 非托管和去中心化:没有集中的中间人控制数据代币,没有单点故障。
- 抗审查,灵活:默认情况下,每个人都可以以相同条件进行交易,也可以设置白名单以满足数据法规或KYC要求。
- 买卖私有数据同时保护隐私:使用Ocean Compute-to-Data,数据不会离开本地。
- 可追溯性:买卖双方可以审计购买交易。
- 货币化:市场可以收取销售佣金,确保数据市场业务可持续发展。

AMM池还具有以下特点:
- 自动价格发现:池中的数据代币价格会根据买卖自动调整。
- 整理(质押 = 提供流动性):提供真实的数据集质量信号。
- 流动性提供者、整理者和质押者可获得交易费用。
- 推荐激励:流动性提供者有动力推荐他们获得交易费用的数据池。

3. Ocean工具的计算到数据(Compute - to - Data)

3.1 动机

私有数据是指个人或组织希望保密的数据,包括个人、医疗、金融等敏感信息。隐私工具旨在实现信息的不对称共享,在确保他人看不到信息的同时,将信息提供给需要的人。

私有数据对研究和创新有很大帮助,能提高现代人工智能模型的预测准确性,是公司的竞争优势。但共享或出售私有数据存在风险,如因隐私信息导致就业受阻或受到迫害,大型组织因担心数据泄露和相关责任而不敢利用数据。

Compute - to - Data的理念是在让数据留在本地的同时,允许第三方在数据上运行特定计算任务,以获得有用的分析结果,如平均值或构建人工智能模型,从而在获取数据价值的同时降低隐私风险。

3.2 概念工作原理

如下图所示,数据科学家Alice在数据市场购买了卖家Bob的私有数据访问权限。她在Bob的私有数据上运行经Bob批准的人工智能建模算法,私下训练模型,模型也由Bob私下存储。然后她在新输入数据上运行训练好的私有模型,得到模型预测结果,这是她唯一能看到的数据。这样Alice得到了想要的预测,Bob也保护了自己的数据隐私。

graph LR
    A[数据科学家Alice] --> B[数据市场]
    B --> C[卖家Bob的私有数据]
    A --> D[运行AI建模算法]
    D --> C
    C --> E[训练模型]
    E --> F[新输入数据]
    F --> G[模型预测结果]
    A --> G

核心是数据代币,它授予在数据附近运行计算的访问权限,可在市场或其他场景中使用。

3.3 Compute - to - Data的流程变体

3.3.1 模型可下载情况

如果Bob认为模型泄露个人身份信息(PII)的风险较低,如线性模型或小型神经网络,Alice可以下载训练好的模型。

3.3.2 跨数据孤岛学习

Alice可以跨多个数据孤岛学习模型,即“联邦学习”。

3.3.3 非模型训练计算
  • 可以在数据附近运行简单的“聚合”函数,如平均值、中位数或简单的一维密度估计,适用于简单的商业智能(BI)用例。
  • 可以跨多个数据孤岛计算聚合函数,即“联邦分析”。
  • 可以在Bob的数据附近运行合成数据生成算法,Alice下载合成数据进行可视化或训练模型。
  • 可以为Bob数据的每个{输入变量,输入值}组合计算哈希值,哈希自然地对数据进行匿名化,Alice下载哈希数据在客户端训练模型,即“解耦哈希”。
  • 可以向Bob的数据集添加随机噪声,使数据被认为是匿名的,Alice下载部分随机化的数据在客户端训练模型,这是“差分隐私”的一种变体。

3.4 共享或货币化

Compute - to - Data既适用于科学或技术领域的数据共享,也适用于在保护隐私的同时货币化私有数据。私有数据不是直接出售,而是出售特定的访问权限,即“仅供计算使用”的访问权限。因此,数据市场中的Compute - to - Data为公司提供了货币化其数据资产的机会。

3.5 Compute - to - Data架构

3.5.1 新参与者

Ocean协议原有的参与者包括数据提供者、数据消费者和市场,Compute - to - Data增加了计算提供者,计算提供者出售数据上的计算服务,而不是数据本身。

3.5.2 新组件
  • 操作员服务(Operator Service):一个微服务,负责管理工作流程和执行请求。它直接与提供者(数据提供者的代理服务器)通信并接收命令,对提供者提供的数据进行计算。
  • 操作员引擎(Operator Engine):一个后端服务,负责使用Kubernetes作为后端编排计算基础设施。通常,操作员引擎从Kubernetes中检索操作员服务创建的工作流程,并管理完成计算工作流程执行所需的基础设施。
3.5.3 新资产类型

之前,数据集是元数据(DDO)中唯一的资产类型。Compute - to - Data引入了新的资产类型——算法,它是可以在数据集上执行的脚本。

3.6 市场和Compute - to - Data

市场可以允许用户发布启用Compute - to - Data的数据集,有些市场甚至可能要求这样做。市场可以选择向最终用户提供哪些具体的计算资源,包括在Kubernetes集群中选择不同的镜像和资源。同样,市场可以选择和限制允许用户在市场数据集中运行的算法类型。

3.7 信任算法

只需要在一个狭窄的方面信任算法:算法是否有可忽略不计的PII泄露风险。例如,简单的平均函数可以充分聚合数据以避免泄露PII,人工智能算法也能聚合信息。

数据所有者通常选择信任哪些算法,这是他们的判断。他们可能会检查代码,在沙箱中运行以查看其依赖项、通信和使用的资源。

以下是Compute - to - Data涉及的新元素总结表格:
| 新元素类型 | 具体内容 | 说明 |
| ---- | ---- | ---- |
| 新参与者 | 计算提供者 | 出售数据上的计算服务 |
| 新组件 | 操作员服务 | 管理工作流程和执行请求 |
| | 操作员引擎 | 编排计算基础设施 |
| 新资产类型 | 算法 | 可在数据集上执行的脚本 |

同步定位与地图构建(SLAM)技术为移动机器人或自主载具在未知空间中的导航提供了核心支撑。借助该技术,机器人能够在探索过程中实时构建环境地图并确定自身位置。典型的SLAM流程涵盖传感器数据采集、数据处理、状态估计及地图生成等环节,其核心挑战在于有效处理定位与环境建模中的各类不确定性。 Matlab作为工程计算与数据可视化领域广泛应用的数学软件,具备丰富的内置函数与专用工具箱,尤其适用于算法开发与仿真验证。在SLAM研究方面,Matlab可用于模拟传感器输出、实现定位建图算法,并进行系统性能评估。其仿真环境能显著降低实验成本,加速算法开发与验证周期。 本次“SLAM-基于Matlab的同步定位与建图仿真实践项目”通过Matlab平台完整再现了SLAM的关键流程,包括数据采集、滤波估计、特征提取、数据关联与地图更新等核心模块。该项目不仅呈现了SLAM技术的实际应用场景,更为机器人导航与自主移动领域的研究人员提供了系统的实践参考。 项目涉及的核心技术要点主要包括:传感器模型(如激光雷达与视觉传感器)的建立与应用、特征匹配与数据关联方法、滤波器设计(如扩展卡尔曼滤波与粒子滤波)、图优化框架(如GTSAM与Ceres Solver)以及路径规划与避障策略。通过项目实践,参与者可深入掌握SLAM算法的实现原理,并提升相关算法的设计与调试能力。 该项目同时注重理论向工程实践的转化,为机器人技术领域的学习者提供了宝贵的实操经验。Matlab仿真环境将复杂的技术问题可视化与可操作化,显著降低了学习门槛,提升了学习效率与质量。 实践过程中,学习者将直面SLAM技术在实际应用中遇到的典型问题,包括传感器误差补偿、动态环境下的建图定位挑战以及计算资源优化等。这些问题的解决对推动SLAM技术的产业化应用具有重要价值。 SLAM技术在工业自动化、服务机器人、自动驾驶及无人机等领域的应用前景广阔。掌握该项技术不仅有助于提升个人专业能力,也为相关行业的技术发展提供了重要支撑。随着技术进步与应用场景的持续拓展,SLAM技术的重要性将日益凸显。 本实践项目作为综合性学习资源,为机器人技术领域的专业人员提供了深入研习SLAM技术的实践平台。通过Matlab这一高效工具,参与者能够直观理解SLAM的实现过程,掌握关键算法,并将理论知识系统应用于实际工程问题的解决之中。 资源来源于网络分享,仅用于学习交流使用,请勿用于商业,如有侵权请联系我删除!
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值