剖析 Fiber 架构下 Concurrent 模式的实现原理

最新推荐文章于 2023-08-24 17:25:59 发布

从人到猿

最新推荐文章于 2023-08-24 17:25:59 发布

阅读量692

点赞数 3

分类专栏：深入浅出搞定 React 文章标签： react.js 前端

本文链接：https://blog.youkuaiyun.com/qq_39200185/article/details/121396874

版权

深入浅出搞定 React 专栏收录该内容

22 篇文章

订阅专栏

剖析 Fiber 架构下 Concurrent 模式的实现原理

先来回顾几个函数，检验学习效果：

performSyncWorkOnRoot
workLoopSync
performUnitOfWork
beginWork
completeWork
completeUnitOfWork
reconcileChildFibers

如果对这些函数的执行时机和工作内容仍然感到不那么熟悉，那么不妨回到之前的文章，结合案例和源码，重新捋顺一遍自己的思路，再回来续上知识链路。

本文重点：认识 Fiber 架构最迷人的那一面——Concurrent 模式（异步渲染）下的“时间切片”和“优先级”实现。

current 树与 workInProgress 树：“双缓冲”模式在 Fiber 架构下的实现

什么是“双缓冲”模式

“双缓冲”模式其实是一种在游戏领域由来已久的经典设计模式。在计算机图形领域，通过让图形硬件交替读取两套缓冲数据，可以实现画面的无缝切换，减少视觉效果上的抖动甚至卡顿。而在 React 中，双缓冲模式的主要利好，则是能够帮我们较大限度地实现 Fiber 节点的复用，从而减少性能方面的开销。

current 树与 workInProgress 树之间是如何“相互利用”的

在 React 中，current树与 workInProgress树，两棵树可以对标“双缓冲”模式下的两套缓冲数据：当 current树呈现在用户眼前时，所有的更新都会由 workInProgress树来承接。workInProgress树将会在用户看不到的地方（内存里）悄悄地完成所有改变，直到“灯光”打到它身上，也就是 current指针指向它的时候，此时就意味着 commit阶段已经执行完毕，workInProgress树变成了那棵呈现在界面上的 current树。

接下来用一个 Demo，切身感受一把 workInProgress树和 current树“相互利用”的过程。代码如下：

import { useState } from 'react';
function App() {
  const [state, setState] = useState(0)
  return (
    <div className="App">
      <div onClick={() => { setState(state + 1) }} className="container">
        <p style={{ width: 128, textAlign: 'center' }}>
          {state}
        </p>
      </div>
    </div>
  );
}
export default App;

挂载后的 Fiber 树

挂载时的 render阶段结束后，commit 执行前，两棵 Fiber树的形态，如下图所示：

在这里插入图片描述

待 commit阶段完成后，右侧的 workInProgress树对应的 DOM 树就被真正渲染到了页面上，此时 current指针会指向 workInProgress树：

在这里插入图片描述

由于挂载是一个从无到有的过程，在这个过程中我们是在不断地创建新节点，因此还谈不上什么“节点复用”。节点复用要到更新过程中去看。

第一次更新

点击数字 0，触发一次更新。这次更新中，下图高亮的 rootFiber节点就会被复用：

在这里插入图片描述

这段复用的逻辑在 beginWork调用链路中的 createWorkInProgress方法里。这里截取了 createWorkInProgress方法里面一段非常关键的逻辑，请看下图：

在这里插入图片描述

在 createWorkInProgress方法中，会先取当前节点的 alternate属性，将其记为 workInProgress节点。对于 rootFiber节点来说，它的 alternate属性，其实就是上一棵 current树的 rootFiber，如下图高亮部分所示：

在这里插入图片描述

当检查到上一棵 current 树的 rootFiber 存在时，React 会直接复用这个节点，让它作为下一棵 workInProgress 的节点存在下去，也就是说会走进 createWorkInProgress的 else逻辑里去。如果它和目标的 workInProgress节点之间存在差异，直接在该节点上修改属性、使其与目标节点一致即可，而不必再创建新的 Fiber 节点。

至于剩下的 App、div、p 等节点，由于没有对应的 alternate节点存在，因此它们的 createWorkInProgress 调用会走进下图高亮处的逻辑中：

在这里插入图片描述

在这段逻辑里，将调用 createFiber来新建一个 FiberNode。

第一次更新结束后，我们会得到一棵新的 workInProgressFiber 树，current 指针最后将会指向这棵新的 workInProgress Fiber 树，如下图所示：

在这里插入图片描述

第二次更新

接下来再次点击数字 1，触发 state的第二次更新。

在这次更新中，current树中的每一个 alternate属性都不为空（如上图所示）。因此每次通过 beginWork触发 createWorkInProgress调用时，都会一致地走入 else里面的逻辑，也就是直接复用现成的节点。以上便是 current树和 work树相互“打配合”，实现节点复用的过程。

更新链路要素拆解

同步模式下的更新链路与挂载链路的 render阶段基本是一致的，都是通过 performSyncWorkOnRoot来触发包括 beginWork、completeWork在内的深度优先搜索过程。展示一个更新过程的调用栈，请看下图：

在这里插入图片描述

你会发现还是熟悉的配方，还是原来的味道。其实，挂载可以理解为一种特殊的更新，ReactDOM.render 和 setState 一样，也是一种触发更新的姿势。在 React 中，ReactDOM.render、setState、useState等方法都是可以触发更新的，这些方法发起的调用链路很相似，是因为它们最后“殊途同归”，都会通过创建 update 对象来进入同一套更新工作流。

update 的创建

继续以开篇的 Demo 为例，为你拆解更新链路中的要素。在点击数字后，点击相关的回调被执行，它首先触发的是 dispatchAction这个方法，如下图所示：

在这里插入图片描述

请关注图中两处标红的函数调用，你会看到 dispatchAction方法在 performSyncWorkOnRoot的左边。也就是说整体的更新链路应该是这样的：

在这里插入图片描述

dispatchAction中，会完成 update对象的创建，如下图标红处所示：

在这里插入图片描述

从 update 对象到 scheduleUpdateOnFiber

updateContainer 函数中的相关逻辑：

在这里插入图片描述

图中这一段代码的逻辑是非常清晰的，以 enqueueUpdate为界，它一共做了以下三件事。

enqueueUpdate之前：创建 update。
enqueueUpdate调用：将 update 入队。这里简单说下，每一个 Fiber节点都会有一个属于它自己的 updateQueue，用于存储多个更新，这个 updateQueue 是以链表的形式存在的。在 render阶段，updateQueue 的内容会成为 render 阶段计算 Fiber 节点的新 state 的依据。
scheduleUpdateOnFiber：调度 update。如果你对之前学过的知识还有印象，会记得同步挂载链路中，这个方法后面紧跟的就是 performSyncWorkOnRoot所触发的 render阶段，如下图所示：

现在再回过头来看 dispatchAction的逻辑，你会发现 dispatchAction里面同样有对这三个动作的处理。上面我对 dispatchAction的局部截图，包含了对 update对象的创建和入队处理。dispatchAction的更新调度动作，在函数的末尾

这里有一个点需要提示一下：dispatchAction中，调度的是当前触发更新的节点，这一点和挂载过程需要区分开来。在挂载过程中，updateContainer会直接调度根节点。其实，对于更新这种场景来说，大部分的更新动作确实都不是由根节点触发的，而 render阶段的起点则是根节点。因此在 scheduleUpdateOnFiber中，有这样一个方法，见下图标红处：

在这里插入图片描述

markUpdateLaneFromFiberToRoot将会从当前 Fiber 节点开始，向上遍历直至根节点，并将根节点返回。

scheduleUpdateOnFiber 如何区分同步还是异步？

如果对之前的同步渲染链路分析还有印象，相信对下面这段逻辑不会陌生：

在这里插入图片描述

这是 scheduleUpdateOnFiber中的一段逻辑。在同步的渲染链路中，lane === SyncLane 这个条件是成立的，因此会直接进入 performSyncWorkOnRoot的逻辑，开启同步的 render流程；而在异步渲染模式下，则将进入 else的逻辑。

在 else中，需要引起你注意的是 ensureRootIsScheduled这个方法，该方法很关键，它将决定如何开启当前更新所对应的 render阶段。在 ensureRootIsScheduled中，有这样一段核心逻辑（解析在注释里）：

if (newCallbackPriority === SyncLanePriority) {
    // 同步更新的 render 入口
    newCallbackNode = scheduleSyncCallback(performSyncWorkOnRoot.bind(null, root));
  } else {
    // 将当前任务的 lane 优先级转换为 scheduler 可理解的优先级
    var schedulerPriorityLevel = lanePriorityToSchedulerPriority(newCallbackPriority);
    // 异步更新的 render 入口
    newCallbackNode = scheduleCallback(schedulerPriorityLevel, 		              performConcurrentWorkOnRoot.bind(null, root));
  }

请关注performSyncWorkOnRoot 和 performConcurrentWorkOnRoot 这两个方法：前者是同步更新模式下的 render 阶段入口；而后者是异步模式下的 render 阶段入口。

从这段逻辑中我们可以看出，React 会以当前更新任务的优先级类型为依据，决定接下来是调度 performSyncWorkOnRoot还是 performConcurrentWorkOnRoot。这里调度任务用到的函数分别是 scheduleSyncCallback和 scheduleCallback，这两个函数在内部都是通过调用 unstable_scheduleCallback 方法来执行任务调度的。而 unstable_scheduleCallback正是 Scheduler（调度器）中导出的一个核心方法，也是本讲的一个重点。

Scheduler——“时间切片”与“优先级”的幕后推手

Scheduler 从架构上来看，是 Fiber 架构分层中的“调度层”；从实现上来看，它并非一段内嵌的逻辑，而是一个与 react-dom 同级的文件夹，其中收敛了所有相对通用的调度逻辑。

Fiber 架构下的异步渲染（即 Concurrent模式）的核心特征分别是“时间切片”与“优先级调度”。而这两点，也正是 Scheduler的核心能力。接下来，我们就以这两个特征为线索，解锁 Scheduler的工作原理。

结合 React 调用栈，理解时间切片现象

在理解时间切片的实现原理之前，我们首先要搞清楚时间切片是一种什么样的现象。

在 ReactDOM.render 相关的课时中，曾经强调过，同步渲染模式下的 render 阶段，是一个同步的、深度优先搜索的过程。同步的过程会带来什么样的麻烦呢？我们直接通过调用栈来理解它，下面是一个渲染工作量相对比较大的 React Demo，代码如下：

import React from 'react';
function App() {
  const arr = new Array(1000).fill(0)
  const renderContent = arr.map(
    (i, index) => <p style={{ width: 128, textAlign: 'center' }}>{`测试文本第${index}行`}</p>
  )
  return (
    <div className="App">
      <div className="container">
        {
          renderContent
        }
      </div>
    </div>
  );
}
export default App;

当我使用 ReactDOM.render 来渲染这个长列表时，它的调用栈如下图所示：

在这里插入图片描述

不必再重复去关注 beginWork、completeWork 之流了，请把目光放在这张图中调用栈的上层，也就是图中标红的地方——一个不间断的灰色“Task”长条，对浏览器来说就意味着是一个不可中断的任务。

&emsp;若将 ReactDOM.render调用改为 createRoot 调用（即开启 Concurrent 模式），调用栈就会变成下面这样：

在这里插入图片描述

你会发现那一个不间断的 Task 长条（大任务），如今像是被“切”过了一样，已经变成了多个断断续续的 Task “短条”（小任务），单个短 Task 的执行时长在我的浏览器中是 5ms 左右。这些短 Task 的工作量加起来，和之前长 Task 工作量是一样的。但短 Task 之间留出的时间缝隙，却给了浏览器喘息的机会，这就是所谓的“时间切片”效果。

时间切片是如何实现的？

在同步渲染中，循环创建 Fiber 节点、构建 Fiber 树的过程是由 workLoopSync 函数来触发的。这里我们来复习一下 workLoopSync 的源码，请看下图：

function workLoopSync () {
	while (workInProgress !== null) {
        	preformUnitOfWork(workInProgress);
	}
}

houldYield直译过来的话是“需要让出”。顾名思义，当 shouldYield() 调用返回为 true 时，就说明当前需要对主线程进行让出了，此时 whille 循环的判断条件整体为 false，while 循环将不再继续。

那么这个 shouldYield又是何方神圣呢？在源码中，我们可以寻得这样两行赋值语句：

var Scheduler_shouldYield = Scheduler.unstable_shouldYield,
......
var shouldYield = Scheduler_shouldYield;

从这两行代码中我们可以看出，shouldYield的本体其实是 Scheduler.unstable_shouldYield，也就是 Scheduler包中导出的 unstable_shouldYield方法，该方法本身比较简单。其源码如下图标红处所示：

在这里插入图片描述

其中 unstable_now这里实际取的就是 performance.now() 的值，即“当前时间”。那么 deadline又是什么呢？它可以被理解为当前时间切片的到期时间，它的计算过程在 Scheduler包中的 performWorkUntilDeadline方法里可以找到，也就是下图的标红部分：

在这里插入图片描述

在这行算式里，currentTime是当前时间，yieldInterval是时间切片的长度。注意，时间切片的长度并不是一个常量，它是由 React 根据浏览器的帧率大小计算所得出来的，与浏览器的性能有关。

现在我们来总结一下时间切片的实现原理：React 会根据浏览器的帧率，计算出时间切片的大小，并结合当前时间计算出每一个切片的到期时间。在 workLoopConcurrent中，while循环每次执行前，会调用 shouldYield函数来询问当前时间切片是否到期，若已到期，则结束循环、出让主线程的控制权。

优先级调度是如何实现的

无论是 scheduleSyncCallback还是 scheduleCallback，最终都是通过调用 unstable_scheduleCallback 来发起调度的。unstable_scheduleCallback是 Scheduler导出的一个核心方法，它将结合任务的优先级信息为其执行不同的调度逻辑。

接下来结合源码，一起看看这个过程是如何实现的（解析在注释里）。

function unstable_scheduleCallback(priorityLevel, callback, options) {
  // 获取当前时间
  var currentTime = exports.unstable_now();
  // 声明 startTime，startTime 是任务的预期开始时间
  var startTime;
  // 以下是对 options 入参的处理
  if (typeof options === 'object' && options !== null) {
    var delay = options.delay;
    // 若入参规定了延迟时间，则累加延迟时间
    if (typeof delay === 'number' && delay > 0) {
      startTime = currentTime + delay;
    } else {
      startTime = currentTime;
    }
  } else {
    startTime = currentTime;
  }
  // timeout 是 expirationTime 的计算依据
  var timeout;
  // 根据 priorityLevel，确定 timeout 的值
  switch (priorityLevel) {
    case ImmediatePriority:
      timeout = IMMEDIATE_PRIORITY_TIMEOUT;
      break;
    case UserBlockingPriority:
      timeout = USER_BLOCKING_PRIORITY_TIMEOUT;
      break;
    case IdlePriority:
      timeout = IDLE_PRIORITY_TIMEOUT;
      break;
    case LowPriority:
      timeout = LOW_PRIORITY_TIMEOUT;
      break;
    case NormalPriority:
    default:
      timeout = NORMAL_PRIORITY_TIMEOUT;
      break;
  }
  // 优先级越高，timout 越小，expirationTime 越小
  var expirationTime = startTime + timeout;
  // 创建 task 对象
  var newTask = {
    id: taskIdCounter++,
    callback: callback,
    priorityLevel: priorityLevel,
    startTime: startTime,
    expirationTime: expirationTime,
    sortIndex: -1
  };
  {
    newTask.isQueued = false;
  }
  // 若当前时间小于开始时间，说明该任务可延时执行(未过期）
  if (startTime > currentTime) {
    // 将未过期任务推入 "timerQueue"
    newTask.sortIndex = startTime;
    push(timerQueue, newTask);
    // 若 taskQueue 中没有可执行的任务，而当前任务又是 timerQueue 中的第一个任务
    if (peek(taskQueue) === null && newTask === peek(timerQueue)) {
      ......
          // 那么就派发一个延时任务，这个延时任务用于检查当前任务是否过期
      requestHostTimeout(handleTimeout, startTime - currentTime);
    }
  } else {
    // else 里处理的是当前时间大于 startTime 的情况，说明这个任务已过期
    newTask.sortIndex = expirationTime;
    // 过期的任务会被推入 taskQueue
    push(taskQueue, newTask);
    ......
    // 执行 taskQueue 中的任务
    requestHostCallback(flushWork);
  }
  return newTask;
}

从源码中我们可以看出，unstable_scheduleCallback的主要工作是针对当前任务创建一个 task，然后结合 startTime信息将这个 task推入 timerQueue 或 taskQueue，最后根据 timerQueue和 taskQueue的情况，执行延时任务或即时任务。

要想理解这个过程，首先要搞清楚以下几个概念。

startTime：任务的开始时间。
expirationTime：这是一个和优先级相关的值，expirationTime越小，任务的优先级就越高。
timerQueue：一个以 startTime为排序依据的小顶堆，它存储的是 startTime大于当前时间（也就是待执行）的任务。
taskQueue：一个以 expirationTime为排序依据的小顶堆，它存储的是 startTime小于当前时间（也就是已过期）的任务。

堆是一种特殊的完全二叉树。如果对一棵完全二叉树来说，它每个结点的结点值都不大于其左右孩子的结点值，这样的完全二叉树就叫“小顶堆”。小顶堆自身特有的插入和删除逻辑，决定了无论我们怎么增删小顶堆的元素，其根节点一定是所有元素中值最小的一个节点。这样的性质，使得小顶堆经常被用于实现优先队列。

结合小顶堆的特性，我们再来看源码中涉及 timerQueue和 taskQueue的操作，这段代码同时也是整个 unstable_scheduleCallback方法中的核心逻辑：

// 若当前时间小于开始时间，说明该任务可延时执行(未过期）
  if (startTime > currentTime) {
    // 将未过期任务推入 "timerQueue"
    newTask.sortIndex = startTime;
    push(timerQueue, newTask);
    // 若 taskQueue 中没有可执行的任务，而当前任务又是 timerQueue 中的第一个任务
    if (peek(taskQueue) === null && newTask === peek(timerQueue)) {
      ......
          // 那么就派发一个延时任务，这个延时任务用于将过期的 task 加入 taskQueue 队列
      requestHostTimeout(handleTimeout, startTime - currentTime);
    }
  } else {
    // else 里处理的是当前时间大于 startTime 的情况，说明这个任务已过期
    newTask.sortIndex = expirationTime;
    // 过期的任务会被推入 taskQueue
    push(taskQueue, newTask);
    ......
    // 执行 taskQueue 中的任务
    requestHostCallback(flushWork);
  }

若判断当前任务是待执行任务，那么该任务会在 sortIndex属性被赋值为 startTime后，被推入 timerQueue。随后，会进入这样的一段判断逻辑：

// 若 taskQueue 中没有可执行的任务，而当前任务又是 timerQueue 中的第一个任务
if (peek(taskQueue) === null && newTask === peek(timerQueue)) {
  ......
    // 那么就派发一个延时任务，这个延时任务用于将过期的 task 加入 taskQueue 队列
  requestHostTimeout(handleTimeout, startTime - currentTime);
}

要理解这段逻辑，首先需要理解 peek()做了什么：peek()的入参是一个小顶堆，它将取出这个小顶堆的堆顶元素。

taskQueue里存储的是已过期的任务，peek(taskQueue)取出的任务若为空，则说明 taskQueue为空、当前并没有已过期任务。在没有已过期任务的情况下，会进一步判断 timerQueue，也就是未过期任务队列里的情况。

而通过前面的科普，大家已经知道了小顶堆是一个相对有序的数据结构。timerQueue作为一个小顶堆，它的排序依据其实正是 sortIndex 属性的大小。这里的 sortIndex属性取值为 startTime，意味着小顶堆的堆顶任务一定是整个 timerQueue 堆结构里 startTime 最小的任务，也就是需要最早被执行的未过期任务。

若当前任务（newTask）就是 timerQueue中需要最早被执行的未过期任务，那么 unstable_scheduleCallback会通过调用 requestHostTimeout，为当前任务发起一个延时调用。

注意，这个延时调用（也就是 handleTimeout）并不会直接调度执行当前任务——它的作用是在当前任务到期后，将其从 timerQueue中取出，加入 taskQueue中，然后触发对 flushWork的调用。真正的调度执行过程是在 flushWork中进行的。flushWork 中将调用 workLoop，workLoop 会逐一执行 taskQueue 中的任务，直到调度过程被暂停（时间片用尽）或任务全部被清空。

以上便是针对未过期任务的处理。在这个基础上，我们不难理解 else 中，对过期任务的处理逻辑（也就是下面这段代码）：

{
  // else 里处理的是当前时间大于 startTime 的情况，说明这个任务已过期
  newTask.sortIndex = expirationTime;
  // 过期的任务会被推入 taskQueue
  push(taskQueue, newTask);
  ......
  // 执行 taskQueue 中的任务
  requestHostCallback(flushWork);
}

与 timerQueue不同的是，taskQueue 是一个以 expirationTime为 sortIndex（排序依据）的小顶堆。对于已过期任务，React 在将其推入 taskQueue 后，会通过 requestHostCallback(flushWork)发起一个针对 flushWork的即时任务，而 flushWork会执行 taskQueue中过期的任务。

从 React 17.0.0 源码来看，当下 React 发起 Task 调度的姿势有两个：setTimeout、MessageChannel。在宿主环境不支持 MessageChannel的情况下，会降级到 setTimeout。但不管是 setTimeout还是 MessageChannel，它们发起的都是异步任务。

因此 requestHostCallback发起的“即时任务”最早也要等到下一次事件循环才能够执行。“即时”仅仅意味它相对于“延时任务”来说，不需要等待指定的时间间隔，并不意味着同步调用。

unstable_scheduleCallback方法的工作流大图：

在这里插入图片描述