Dapr for dotnet | 状态管理-State management

原创

已于 2022-03-26 12:42:06 修改 · 1.2k 阅读

4 ·

CC 4.0 BY-SA版权

文章标签：

#dapr #dapr state #state store #CAP #并发 / ETag

于 2022-03-22 18:41:39 首次发布

本文详细介绍了应用的有状态和无状态服务的区别，包括它们的优缺点。有状态服务保存用户上下文，方便但难以扩展；无状态服务则不保存上下文，易于扩展但需要额外的持久存储。Dapr提供了一种状态管理解决方案，支持强一致性与最终一致性，以及并发控制，允许在分布式系统中构建有状态服务。此外，Dapr还支持状态的批量操作和跨应用程序共享，并提供了多种并发控制策略，如ETag，以应对并发冲突。Dapr的状态管理API允许开发者轻松实现状态的保存、获取、删除和查询。

什么是应用的 “有状态” 和 “无状态” ？

当用户登录时，将 session 或者 token 传给应用服务器管理，应用服务器里持有用户的上下文信息，并且给用户一个 cookie 值，记录对应的 session（或用户 id 值，记录对应的 token）。然后下次请求，用户携带 cookie 值来，我们就能识别到对应 session，从而找到用户的信息。这时应用服务器是 “有状态” 的。

同样用户登陆时，我们将 session 或 token 存储在第三方的一些服务或者中间件上，比如存储在 redis 上。此时应用服务器不保存上下文信息，只负责对用户的每次请求进行处理，然后返回处理的结果即可，这时应用服务器是“无状态” 的。

应用的 “有状态” 和 “无状态” 的优缺点

有状态服务

【定义】服务端需要记录每次会话的客户端信息，从而识别客户端身份，根据用户身份信息进行请求的处理，并响应相应的处理结果。

【有状态服务的优点】

当状态是共享的跨调用时，开发是容易的；
不需要额外的持久存储；
通常，为低延时优化；

【有状态服务的缺点】

服务端保存大量数据，增加服务端压力；
伸缩扩展复杂，服务端保存用户状态，无法进行水平扩展；
客户端请求依赖服务端，多次请求必须访问同一个服务（或同一台服务器）；

无状态服务

【定义】客户端的每次请求必须具备自描述信息，服务端通过这些信息来识别客户端身份。服务端不保存任何客户端请求者信息。

【无状态服务的优点】

服务间数据不需要同步；
动态伸缩，快速扩容；
持久化存储灵活，热备冷备切换容易；
容易水平扩展，服务实现负载均衡；

【无状态服务的缺点】

依赖额外的持久化存储；
客户端请求不依赖服务端的信息，任何多次请求不需要必须访问到同一个服务（或同一台服务器）；
服务端的集群和状态对客户端透明，服务端可以任意的迁移和伸缩，减小服务端的存储压力；

状态化的判断指标

状态化的判断是指两个来自相同发起者的请求在服务器端是否具备上下文关系。

如果是状态化请求，那么服务器端一般都要保存请求的相关信息，每个请求可以默认地使用以前的请求信息。
而无状态的请求，服务器端的处理信息必须全部来自于请求所携带的信息以及可以被所有请求所使用的公共信息。

关于应用的 “有/无状态” 参考以下文章：

分布式系统中的“无状态”和“有状态”详解

构建可伸缩的有状态服务

Dapr 状态管理介绍

在分布式应用环境中，应用程序都是由独立进程的服务组成。虽然每个服务都应是无状态的，但某些服务必须跟踪状态才能完成业务操作。

【案例场景】请考虑电子商务网站的购物篮服务。如果服务无法跟踪状态，则客户可能因为离开网站丢失购物篮内容，从而导致供应商或公司的销售损失和顾客购物的不愉快体验。对于这些情况，需要将状态持久保存在分布式状态存储中。 Dapr 状态管理构建基块简化了状态跟踪，并跨各种数据存储提供高级功能。

使用 Dapr 的状态管理，应用程序可以将数据作为 键/值对 存储在 受支持的状态存储 中并进行查询。这 使您能够构建有状态的、长时间运行的应用程序，这些应用程序可以保存和检索其状态，例如购物车、游戏、即时聊天工具的会话状态。

Dapr 状态管理工作模型

您的应用程序可以使用 Dapr 的状态管理 API，通过状态存储组件来保存、读取和查询键/值对，如下图所示。例如，通过使用 HTTP POST，您可以保存或查询键/值对，并且通过使用 HTTP GET，您可以读取特定键并返回其值。

dapr 状态管理工作模型

Dapr 状态管理具备的能力

在分布式应用程序中的有状态化跟踪，可能面临如下挑战：

应用程序可能需要不同类型的数据存储；
访问和更新数据可能需要不同的一致性级别；
多个用户可以同时更新数据，这需要解决并发冲突；
服务必须重试与数据存储交互时发生的任何短期、暂时性错误；

Dapr 状态管理构建基块解决了这些难题。它简化了跟踪状态，没有依赖关系或第三方存储 SDK 学习曲线。说完了 Dapr 面临挑战，下面我看下 Dapr 具备的能力（或优点）：

可配置的状态存储行为，设置 并发控制（ETag） 和 数据一致性（最终一致、强一致性） 选项；
执行 CRUD，包括 批量更新操作，多个事务操作；
查询和筛选 键/值对（key/value） 数据；
可插拔状态存储，Dapr 数据存储被建模为组件，可以在不修改你的服务代码的情况下进行替换；

数据一致性（CAP）原则

CAP 定理是一组适用于存储状态的分布式系统的原则，包含了以下三个属性。
CAP 定理图
该定理指出，分布式数据系统将在一致性、可用性和分区容错之间做出权衡。而且，任何数据存储只能保证三个属性中的两个（三者不可兼得）：

【一致性（C ）】群集中的每个节点都会使用最新数据进行响应（即使系统必须阻止请求），直到所有副本都更新。如果你向“一致性系统”查询当前正在更新的项，直到所有副本都成功更新，才会获得响应。不过，你将始终收到最新的数据。
【可用性（A）】每个节点都会返回即时响应，即使该响应不是最新数据。如果你向“可用系统”查询正在更新的项，将获得服务此时可以提供的最佳答案。
【分区容错（P）】保证系统继续运行，即使复制的数据节点发生故障或者与其他复制的数据节点断开连接。

分布式应用程序必须处理 P 属性。当服务与网络调用相互通信时，会发生网络中断 P。因此，分布式应用程序必须是 AP 或 CP。

Dapr 状态管理的一致性模式

当使用 强一致性 时，Dapr 会等待所有副本（或指定的quorums）确认后才会确认写入请求。

§ CP 应用程序选择 一致性，而不选择可用性。 Dapr 通过其 强一致性 策略支持此选择。在此方案中，状态存储将在完成写入请求前必须同步更新所有副本（或者，在某些情况下，达到仲裁）。读取操作将跨副本一致地返回最新数据。

当使用 最终一致性 时，Dapr 将在基本数据存储接受写入请求后立即返回，即使这是单个副本。

§ AP 应用程序选择 可用性 ，而不选择一致性。 Dapr 通过 最终一致性 策略支持此选择。请考虑基础数据存储（例如 Azure CosmosDB），它在多个副本上存储冗余数据。借助最终一致性，状态存储会将更新写入副本，并完成客户端的写入请求。之后，存储将异步更新其他副本。读取请求可以从任何副本返回数据（包括尚未收到最新更新的副本）。

查看更多 Dapr 状态存储组件支持的完整度

Reference / Component specs / State stores

注意：由 Dapr 状态存储组件完成附加到该操作的一致性提示。并非所有数据存储都支持这两种一致性级别。如果未设置一致性提示，则默认行为是最终一致性。

并发性（Concurrency）

在了解 Dapr 的状态管理前，我们先了解下并发控制的方案有哪些？

数据库中的并发控制

在数据库中，【并发控制】是指在多个用户/进程/线程同时对数据库进行操作时，如何保证事务的一致性和隔离性并保障并发程度的最大化。

并发冲突场景分析

读-读（read-read）：不存在任何问题；
读-写（read-write）：有隔离性问题，可能遇到脏读，幻读，不可重复读；
写-写（write-write）：有数据更新丢失，脏写问题；

名词解释

名称	说明	备注
脏读	脏读又称无效数据的读出，是指在数据库访问中，事务A 将某一值修改，然后事务B 读取该值，此后 A 因为某种原因撤销对该值的修改，这就导致了B 所读取到的数据是无效的。	值得注意的是，脏读一般是针对于 update 操作的。
幻读	事务A 按照一定条件进行数据读取，期间事务B 插入了相同搜索条件的新数据，事务A 再次按照原先条件进行读取时，发现了事务B 新插入的数据。
不可重复读	如果事务A 按一定条件搜索，期间事务B 删除了符合条件的某一条数据，导致事务A 再次读取时数据少了一条。
更新丢失	应用从数据库读某些值，然后修改后写回新值。当两个事务在同样的对象执行类似操作时，第二个写操作不包括第一个事务修改的值，最终导致第一个事务修改的值可能会丢失。	具体取决于时间窗口。
脏写	事务A 和事务B 同时尝试更新相同的对象，后写的操作会覆盖较早的写入。如果先写的操作是尚未提交的事务的一部分，后写的事务如果将其覆盖。	具体取决于时间窗口。

并发冲突的解决方案

1.乐观的并发控制（乐观锁）

是一种用来解决【写-写】冲突的无锁并发控制，认为事务间争用没有那么多，所以先进行修改，在提交事务前，检查一下事务开始后，有没有新提交改变，如果没有就提交，如果有就放弃并重试。
乐观并发控制类似自选锁。乐观并发控制适用于低数据争用，写冲突比较少的环境。

2.悲观的并发控制（悲观锁）

基于锁（lock）的并发控制，这种方式开销比较高，而且无法避免死锁问题。

3.多版本并发控制（MVCC）

是一种用来解决【读-写】冲突的无锁并发控制，也就是为事务分配单向增长的时间戳：

为每个修改保存一个版本，版本与事务时间戳关联，

读操作只读该事务开始前的数据库的快照。

这样在读操作不用阻塞写操作，写操作不用阻塞读操作的同时，避免了脏读和不可重复读，但不能解决【写-写】冲突。

Dapr 状态管理的并发控制（ETag）

Dapr 支持使用 ETag 的乐观并发控制 / 乐观锁（OCC，Optimistic Concurrency Control）。

🐹 当一个发送请求操作状态时，Dapr 会给返回的状态附加一个ETag 属性。
🐹 当用户代码试图更新或删除一个状态时，它应该通过更新的请求体或删除的 If-Match 头附加的 ETag 属性。

🦀🦀🦀 只有当提供的 ETag 属性与状态存储中的 ETag 属性匹配时，写操作才能成功。

Dapr 之所以选择 OCC，是因为在不少应用中，数据更新冲突都是很少的，因为客户端是按业务上下文自然分割的，可以对不同的数据进行操作。然而，如果你的应用选择使用 ETag，请求可能会因为不匹配的 ETag 而被拒绝。建议您在使用 ETag 时，使用重试策略来补偿这种冲突。

如果您的应用程序在写入请求时省略 ETag，则 Dapr 在处理请求时会跳过 ETag 检查。与使用 ETag 的 first-write-wins（最先写赢） 模式相比，这实质上启用了 last-write-wins（最后写赢） 模式。

【ETag 两种模式的区别】

🦂first-write-wins（最先写赢）：应用程序在写入请求时附带 ETag 属性；
🦂last-write-wins（最后写赢）：应用程序在写入请求时省略 ETag 属性；

first-write-wins 在您有多个应用程序实例的情况下很有用，所有实例都同时写入同一个键。Dapr 状态管理的默认模式是 last-write-wins。

注意：对于原生不支持 ETag 的存储引擎，要求相应的 Dapr 状态存储实现能够模拟ETag，并在处理状态时遵循 Dapr 状态管理 API 规范。由于 Dapr 状态存储实现在技术上是底层数据存储引擎的客户端，所以这种模拟应该直接使用存储引擎提供的并发控制机制。

Actor 状态

事务状态存储可用于存储 Actor 状态。要指定用于 Actor 的状态存储，请在状态存储组件的元数据部分中将属性 actorStateStore 的值指定为 true。

注意：Actors 状态以特定方案存储在事务状态存储中允许一致的查询。所以只能有一个状态存储组件被用于所有的Actor。

Dapr 状态管理的批量操作（bulk 或 multi）

Dapr 支持两种类型的批量操作 - bulk 或 multi。您可以将几个相同类型的请求分组成批量(或批次)。 Dapr 将请求作为单个请求批量提交给基础数据存储。换句话说，批量（bulk）操作不是事务性的。另一方面，您可以将不同类型的请求分组为多（multi）操作，作为原子事务处理。

注意：此功能仅对支持 ACID 事务的数据存储可用。在撰写本文时，这些存储包括 Redis、MongoDB、PostgreSQL、SQL Server和Azure CosmosDB。

Dapr 各存储组件支持情况，请查看：supported-state-stores

Dapr 在不同的应用程序之间共享状态

为了实现状态共享，Dapr 支持以下键前缀策略

appid - 这是默认策略。 appid 前缀允许状态只能由具有指定 appid 的应用程序管理。所有状态键都将以 appid 为前缀，并以应用程序为范围。
name - 此设置使用状态存储组件的名称作为前缀。对于给定的状态存储，多个应用程序可以共享相同的状态。
none - 此设置不使用前缀。多个应用程序在不同的状态存储之间共享状态

举例：要指定前缀策略，请在状态组件上添加名为 keyPrefix 的元数据键

apiVersion: dapr.io/v1alpha1
kind: Component
metadata:
  name: statestore
  namespace: production
spec:
  type: state.redis
  version: v1
  metadata:
  - name: keyPrefix
    value: <key-prefix-strategy>

注意：此示例演示相对较复杂，思路大概是使用多个 statestore.yaml，然后根据不同的 storename 切换不同策略即可。感兴趣的小伙伴可以自行尝试。

了解更多，请查看：

自动加密状态并管理密钥轮换

注意：截止目前，这个功能是个预览版，感兴趣的小伙伴可以自行尝试

应用程序状态通常需要静态加密，以在企业工作负载或受监管环境中提供更强的安全性。 Dapr 提供基于 AES256 的自动客户端加密。

状态的生存时间（TTL）

Dapr 为每个状态在请求时设置生存时间 (TTL)。这意味着应用程序可以为每个存储的状态设置生存时间，并且这些状态在到期后无法检索。

注意：只有一部分 Dapr 状态存储组件与状态 TTL 兼容。对于支持的状态存储，只需在发布消息时设置 ttlInSeconds 元数据。其他状态存储将忽略此值。

await client.SaveStateAsync(storeName, key, value,

最低0.47元/天解锁文章