ArkUI中的线程和看门狗机制

本文详细分析了ArkUI中线程的运作,包括AceContainer、任务执行器的创建,以及不同类型的TaskRunner如PLATFORM、UI、IO、GPU、JS的初始化和执行。此外,还介绍了看门狗机制,特别是其对UI线程和JS线程的监控,以及超时上报系统事件的规则,强调了避免主线程和UI线程卡顿的重要性。

一、前言

本文主要分析ArkUI中涉及的线程和看门狗机制。

二、ArkUI中的线程

应用Ability首次创建界面的流程大致如下:

说明:

• AceContainer是一个容器类,由前端、任务执行器、资源管理器、渲染管线、视图等聚合而成,提供了生命周期对接、功能调度接口和UI渲染的各项能力。

• Ability在FA模型中实际为AceAbility,和AceContainer容器类搭配管理界面。在AceAbility的生命周期函数AceAbility::OnStart(const Want& want)中创建AceContainer实例。

• 对于Stage模型,在UIContentImpl::CommonInitialize()函数中创建AceContainer实例。AceContainer在构造函数中创建任务执行器,用于执行ArkUI相关任务。

void AceContainer::InitializeTask()
{
    auto flutterTaskExecutor = Referenced::MakeRefPtr<FlutterTaskExecutor>();
    flutterTaskExecutor->InitPlatformThread(useCurrentEventRunner_);
    taskExecutor_ = flutterTaskExecutor;
    // No need to create JS Thread for DECLARATIVE_JS
    if (type_ == FrontendType::DECLARATIVE_JS) {
        GetSettings().useUIAsJSThread = true;
    } else {
        flutterTaskExecutor->InitJsThread();
    }
}

任务有如下几种类型,每种类型(BACKGROUND任务除外)的任务会由一个fml::TaskRunner去执行。TaskRunner代码在三方库third_party\flutter\engine\flutter\common\task_runners.h中,实现原理和EventRunner,EventHandler机制相似。

enum class TaskType : uint32_t {
        PLATFORM = 0,
        UI,
        IO,
        GPU,
        JS,
        BACKGROUND,
        UNKNOWN,
    };

FlutterTaskExecutor类图如下:

说明:

• 任务执行器可以用于执行异步(PostTask)和同步(PostSyncTask)任务。

• 异步任务:把任务丢给指定类型的线程处理,不会阻塞当前线程。

• 同步任务:把任务丢给指定类型的线程处理并阻塞当前线程,直到任务执行完后继续当前线程。

• 比如触摸事件的处理,会以异步任务的形式被丢到UI线程中处理。

 auto&& touchEventCallback = [context = pipelineContext_, id = instanceId_](
                                    const TouchEvent& event, const std::function<void()>& markProcess) {
        ContainerScope scope(id);
        context->GetTaskExecutor()->PostTask(
            [context, event, markProcess]() {
                context->OnTouchEvent(event);
                CHECK_NULL_VOID_NOLOG(markProcess);
                markProcess();
            },
            TaskExecutor::TaskType::UI);
    };

三、各种类型的TaskRunner如何初始化?

1. platformRunner_

在InitPlatformThread函数中初始化。

void FlutterTaskExecutor::InitPlatformThread(bool useCurrentEventRunner)
{
#ifdef OHOS_STANDARD_SYSTEM
    platformRunner_ = flutter::PlatformTaskRunner::CurrentTaskRunner(useCurrentEventRunner);
#else
    fml::MessageLoop::EnsureInitializedForCurrentThread();
    platformRunner_ = fml::MessageLoop::GetCurrent().GetTaskRunner();
#endif

    FillTaskTypeTable(TaskType::PLATFORM);
}

对于标准OHOS,platformRunner_实际为

flutter::PlatformTaskRunner::CurrentTaskRunner(useCurrentEventRunner)

看下具体实现:

fml::RefPtr<fml::TaskRunner> PlatformTaskRunner::CurrentTaskRunner(bool useCurrentEventRunner)
{
    return PlatformTaskRunnerAdapter::CurrentTaskRunner(useCurrentEventRunner);
}
fml::RefPtr<fml::TaskRunner> PlatformTaskRunnerAdapter::CurrentTaskRunner(bool useCurrentEventRunner)
{
    if (useCurrentEventRunner) {
        return fml::MakeRefCounted<PlatformTaskRunnerAdapter>(useCurrentEventRunner);
    }
    if (taskRunner_) {
        return taskRunner_;
    }
    taskRunner_ = fml::MakeRefCounted<PlatformTaskRunnerAdapter>(useCurrentEventRunner);
    return taskRunner_;
}

说明:

platformRunner实际类型为PlatformTaskRunnerAdapter。

PlatformTaskRunnerAdapter继承自fml::TaskRunner,实现了virtual void PostTask(fml::closure task)等接口函数。实际是在EventRunner,EventHandler机制基础上又做了层封装。代码中useCurrentEventRunner实参为false。意味着platformRunner实际是把任务丢给主线程去做的。(MainEventRunner对应的线程为主线程,MainEventRunner的初始化在Ability框架MainThread::Start()函数中)

PlatformTaskRunnerAdapter::PlatformTaskRunnerAdapter(bool useCurrentEventRunner)
    : fml::TaskRunner(nullptr)
{
    if (useCurrentEventRunner) {
        eventRunner_ = OHOS::AppExecFwk::EventRunner::Current();
    } else {
        eventRunner_ = OHOS::AppExecFwk::EventRunner::GetMainEventRunner();
    }
    eventHandler_ = std::make_shared<OHOS::AppExecFwk::EventHandler>(eventRunner_);
}

void PlatformTaskRunnerAdapter::PostTask(fml::closure task)
{
    eventHandler_->PostTask(std::move(task));
}

2. uiRunner, ioRunner, gpuRunner_

这三种类型的TaskRunner初始化都在FlutterTaskExecutor::InitOtherThreads函数中。

void FlutterTaskExecutor::InitOtherThreads(const flutter::TaskRunners& taskRunners)
{
    uiRunner_ = taskRunners.GetUITaskRunner();
    ioRunner_ = taskRunners.GetIOTaskRunner();
#ifdef NG_BUILD
    gpuRunner_ = taskRunners.GetRasterTaskRunner();
#else
    gpuRunner_ = taskRunners.GetGPUTaskRunner();
#endif

    //...此处省略若干行
}

FlutterTaskExecutor::InitOtherThreads函数的参数 taskRunners从哪来?

FlutterAceView::CreateView()函数中会初始化一些配置项,然后创建flutter::OhosShellHolder对象。

FlutterAceView* FlutterAceView::CreateView(int32_t instanceId, bool useCurrentEventRunner, bool usePlatformThread)
{
    FlutterAceView* aceSurface = new Platform::FlutterAceView(instanceId);
    if (aceSurface != nullptr) {
        aceSurface->IncRefCount();
    }
    flutter::Settings settings;
    settings.instanceId = instanceId;
    settings.platform = flutter::AcePlatform::ACE_PLATFORM_OHOS;
#ifndef GPU_DISABLED
    settings.enable_software_rendering = false;
#else
    settings.enable_software_rendering = true;
#endif
#ifdef ENABLE_ROSEN_BACKEND
    settings.use_system_render_thread = SystemProperties::GetRosenBackendEnabled();
#endif
    settings.platform_as_ui_thread = usePlatformThread;
    settings.use_current_event_runner = useCurrentEventRunner;
    // ...此处省略若干行
    auto shell_holder = std::make_unique<flutter::OhosShellHolder>(settings, false);
    if (aceSurface != nullptr) {
        aceSurface->SetShellHolder(std::move(shell_holder));
    }
    return aceSurface;
}

OhosShellHolder构造函数中会根据传入的参数创建flutter::TaskRunners。

OhosShellHolder::OhosShellHolder(
    flutter::Settings settings,
    bool is_background_view)
    : settings_(std::move(settings))
{
  // ...此处省略若干行
  // The current thread will be used as the platform thread. Ensure that the
  // message loop is initialized.
  fml::MessageLoop::EnsureInitializedForCurrentThread();
  fml::RefPtr<fml::TaskRunner> gpu_runner;
  fml::RefPtr<fml::TaskRunner> ui_runner;
  fml::RefPtr<fml::TaskRunner> io_runner;
  fml::RefPtr<fml::TaskRunner> platform_runner =
    PlatformTaskRunnerAdapter::CurrentTaskRunner(settings_.use_current_event_runner);
  if (is_background_view) {
    auto single_task_runner = thread_host_.ui_thread->GetTaskRunner();
    gpu_runner = single_task_runner;
    ui_runner = single_task_runner;
    io_runner = single_task_runner;
  } else {
    if (settings_.platform_as_ui_thread) {
      ui_runner = platform_runner;
    } else {
      ui_runner = thread_host_.ui_thread->GetTaskRunner();
    }
    if (!settings_.use_system_render_thread) {
      gpu_runner = thread_host_.gpu_thread->GetTaskRunner();
    } else {
      gpu_runner = ui_runner;
    }
    if (settings_.use_io_thread) {
      io_runner = thread_host_.io_thread->GetTaskRunner();
    } else {
      io_runner = ui_runner;
    }
  }
  flutter::TaskRunners task_runners(thread_label,     // label
                                    platform_runner,  // platform
                                    gpu_runner,       // gpu
                                    ui_runner,        // ui
                                    io_runner         // io
  );

说明:目前OHOS上,配置的参数如下:

对照上面的代码段,实际gpu_runner,ui_runner,io_runner是同一个,任务都在UI线程执行。另外对于Stage模型,ui_runner和platform_runner又是同一个,所以对Stage模型来说,TaskType::UI,TaskType::IO,TaskType::GPU,TaskType::PLATFORM类型的任务实际都是由主线程来执行的。

3. jsRunner_

初始化在FlutterTaskExecutor::InitJsThread(bool newThread)函数中。

void FlutterTaskExecutor::InitJsThread(bool newThread)
{
    if (newThread) {
        jsThread_ = std::make_unique<fml::Thread>(GenJsThreadName());
        jsRunner_ = jsThread_->GetTaskRunner();
    } else {
        jsRunner_ = uiRunner_;
    }

    PostTaskToTaskRunner(
        jsRunner_, [weak = AceType::WeakClaim(this)] { FillTaskTypeTable(weak, TaskType::JS); }, 0);
}

说明:对于声明式前端,newThread参数为false; JS前端为true。所以声明式前端JS线程实际为UI线程;而对于JS前端,会起独立的JS线程来处理JS相关的任务。

4. TaskType::BACKGROUND类型的任务如何执行?

TaskType::BACKGROUND类型的任务会由单例BackgroundTaskExecutor去执行。BackgroundTaskExecutor中维护了一个8个线程的线程池,用来处理后台耗时操作。线程名以"ace.bg."开头。比如RosenFontLoader在加载网络字体的时候,下载操作会放到后台任务线程里去做。

void RosenFontLoader::LoadFromNetwork(const OHOS::Ace::RefPtr<OHOS::Ace::PipelineBase>& context)
{
    auto weakContext = AceType::WeakClaim(AceType::RawPtr(context));
    context->GetTaskExecutor()->PostTask(
        [weak = AceType::WeakClaim(this), weakContext] {
            auto fontLoader = weak.Upgrade();
            auto context = weakContext.Upgrade();
            if (!fontLoader || !context) {
                return;
            }
            std::vector<uint8_t> fontData;
            if (!DownloadManager::GetInstance().Download(fontLoader->familySrc_, fontData) || fontData.empty()) {
                return;
            }
            //...此处省略若干行
        },
        TaskExecutor::TaskType::BACKGROUND);
}

综上:在ArkUI中,会为每个带界面的Ability创建一个AceContainer,每个AceContainer中会创建一个FlutterTaskExecutor用于处理该Ability ArkUI相关的任务。根据不同的模型,ArkUI创建出来的线程会有所不同:

• 对于Stage模型的应用,ui线程复用了主线程,并且Stage模型应用目前都是声明式前端,导致js线程又复用了ui线程。所以ArkUI只需另外创建名字以“ace.bg.”开头的八个后台任务线程。

• 对于FA模型的应用,除了八个后台任务线程,根据Ability的数量会创建若干个名字以“.ui”结尾的线程。如果是JS前端,还会创建若干个名字以“jsThread-”开头的线程。

四、ArkUI中的看门狗

AceEngine是单例,全局唯一。AceEngine的构造函数中会创建WatchDog实例。对于FA模型的应用,AceContainer::AttachView()函数中通过调用

AceEngine::Get().RegisterToWatchDog(instanceId, taskExecutor_,

GetSettings().useUIAsJSThread);

把持有的FlutterTaskExecutor注册到看门狗中看护。

看门狗只看护FlutterTaskExecutor中的UI线程和JS线程。Stage模型的应用由于UI线程和JS线程实际是复用的主线程,所以不需要在ArkUI中看护。Ability框架中有看门狗专门看护主线程。如果线程中有任务处理超过了3s,会上报RawEventType::WARNING对应的系统事件给hiview插件平台;如果任务处理超过了5s,会上报RawEventType::FREEZE对应的系统事件给hiview插件平台,hiview插件平台会生成appfreeze的dump文件。

为了防止主线程和ui线程卡住引起appfreeze,做应用开发的时候,不要在Ability生命周期函数或者控件点击事件等回调函数中做耗时操作。

<think>首先,用户的问题是关于在应用层使用多线程机制实现看门狗功能。我需要参考提供的引用内容来构建回答。 关键引用: - 引用[1]: 讨论了OpenHarmony中的看门狗机制,看护UI线程JS线程,处理超时任务。 - 引用[2]: 描述了Linux看门狗应用编程,包括打开设备、设置选项等。 - 引用[3]: 解释Android看门狗用于监控系统关键服务。 - 引用[4]: 类似引用[1],强调ArkUI中的线程看门狗。 用户具体需求:在应用层(应用级别)使用多线程机制实现看门狗功能。意思是用户想在他们的应用程序中实现一个看门狗机制,使用多线程来监控线程的健康状态。 系统级指令: - 所有行内数学表达式用$...$格式。 - 独立公式用$$...$$格式。 - 使用中文回答。 - 生成相关问题。 - 回答中引用的段落末尾添加引用标识,如[^1]。 - 回答结构清晰,逐步解决问题,保证真实可靠。 回答结构: 1. **理解看门狗机制**:先解释什么是看门狗,为什么需要它。 2. **应用层实现**:讨论如何在应用层实现,使用多线程。 3. **多线程看门狗实现方法**:详细步骤或伪代码。 4. **潜在问题优化**:基于引用,讨论超时处理、事件上报等。 5. **代码示例**:提供简单的代码示例(如Python或类似)。 6. **相关问题**:生成相关问题。 基于引用: - 引用[1][4]提到看门狗监控线程超时(3s警告,5s冻结事件)。 - 引用[2]展示Linux看门狗编程。 - 引用[3]强调检测死锁、阻塞。 所以,实现方法: - 主线程或一个监控线程定期检查其他线程是否活跃。 - 使用心跳机制:被监控线程定期发送信号(如设置标志)。 - 如果超时未收到信号,监控线程触发恢复动作(如重启线程)。 多线程实现: - 创建一个看门狗线程。 - 其他线程注册到看门狗。 - 看门狗线程sleep一段时间,然后检查线程状态。 超时处理:类似引用,设置警告冻结阈值。 代码示例:用Python展示,因为简单易懂。 确保回答真实可靠:基于通用编程概念,而非特定平台。 最后,生成相关问题。 **逐步回答:** 1. 介绍看门狗概念。 2. 解释应用层实现。 3. 描述多线程看门狗机制。 4. 提供伪代码或代码示例。 5. 讨论注意事项。 6. 生成相关问题。 **数学表达式**:可能没有太多数学,但如果有,如超时计算,用$...$格式。 **引用标识**:在相关部分末尾添加[^数字]。 用户引用的来源是给定的,所以我需要在回答中引用它们。</think>### 应用层多线程看门狗实现方法 在应用层实现看门狗功能,核心是通过多线程机制监控关键线程(如工作线程或UI线程)的健康状态,防止死锁、阻塞或异常导致的系统无响应。看门狗机制的基本原理是:一个独立的监控线程看门狗线程)定期检查其他线程是否在规定时间内“心跳”(即发送活跃信号)。如果超时未收到心跳,看门狗线程会触发恢复动作(如重启线程或上报错误)。这种方法广泛应用于嵌入式系统、移动应用(如Android)服务器端程序[^3]。下面我将逐步解释实现方法,确保回答基于可靠的多线程编程原则参考内容。 #### 1. **看门狗机制的核心概念** - **为什么需要看门狗?**:在应用层,线程可能因死锁、无限循环或资源竞争而挂起,导致应用崩溃。看门狗通过超时检测自动恢复提升系统鲁棒性。例如,引用[1]中提到,超时阈值通常设置为3秒(警告事件)5秒(冻结事件),超过阈值会触发事件上报[^1]。 - **多线程角色**: - **被监控线程**:执行实际任务(如数据处理或UI更新),需定期发送心跳信号。 - **看门狗线程**:独立运行,监控所有注册线程的心跳状态。 - **心跳机制**:每个被监控线程通过共享变量(如标志位或计数器)向看门狗线程发送活跃信号。心跳间隔应小于看门狗的超时阈值,例如设置心跳间隔为1秒,超时阈值为3秒[^2][^3]。 #### 2. **实现步骤(基于多线程机制)** 以下是通用实现方法,适用于Python、Java或C++等语言。核心是线程同步超时处理,参考LinuxAndroid的实现思路[^2][^3]。 **步骤1: 初始化共享资源** - 创建线程安全的共享变量(如字典或数组),用于存储每个被监控线程的心跳时间戳。 - 使用互斥锁(mutex)或原子操作确保数据一致性,避免竞态条件。 **步骤2: 注册被监控线程** - 每个工作线程启动时,向看门狗线程注册自己,并初始化心跳时间戳。 - 示例伪代码: ```python import threading import time # 共享资源:存储线程ID最后心跳时间 heartbeat_dict = {} heartbeat_lock = threading.Lock() def register_thread(thread_id): with heartbeat_lock: heartbeat_dict[thread_id] = time.time() ``` **步骤3: 实现心跳发送** - 被监控线程在任务循环中定期更新心跳时间戳。间隔建议为$t_h$(例如1秒),确保$t_h < T_{\text{timeout}}$(超时阈值)。 ```python def worker_thread(thread_id): register_thread(thread_id) while True: # 执行实际任务... time.sleep(0.5) # 模拟任务执行 # 发送心跳:更新共享变量 with heartbeat_lock: heartbeat_dict[thread_id] = time.time() ``` **步骤4: 实现看门狗线程** - 看门狗线程循环检查所有注册线程的心跳状态: - 如果当前时间与最后心跳时间的差值超过阈值$T_{\text{warn}}$(如3秒),触发警告事件。 - 如果超过$T_{\text{freeze}}$(如5秒),触发恢复动作(如重启线程或上报错误)。 - 参考引用[1],超时事件可上报给日志系统或监控平台[^1]。 ```python def watchdog_thread(timeout_warn=3, timeout_freeze=5): while True: current_time = time.time() with heartbeat_lock: for thread_id, last_beat in list(heartbeat_dict.items()): delta = current_time - last_beat if delta > timeout_freeze: # 严重超时:重启线程或上报冻结事件 print(f"Thread {thread_id} frozen! Restarting...") # 可选:重启线程或记录错误 del heartbeat_dict[thread_id] elif delta > timeout_warn: # 警告:上报但不立即恢复 print(f"Thread {thread_id} warning: slow response") time.sleep(1) # 检查间隔,建议小于超时阈值 ``` **步骤5: 启动线程** - 主线程创建并启动工作线程看门狗线程。 ```python if __name__ == "__main__": # 创建启动工作线程 worker1 = threading.Thread(target=worker_thread, args=(1,)) worker2 = threading.Thread(target=worker_thread, args=(2,)) worker1.start() worker2.start() # 启动看门狗线程 watchdog = threading.Thread(target=watchdog_thread) watchdog.start() ``` #### 3. **关键注意事项** - **超时阈值设置**:根据应用需求调整$T_{\text{warn}}$$T_{\text{freeze}}$。引用[1]建议3秒警告5秒冻结,但需测试避免误报[^1]。 - **线程安全**:共享变量必须用锁保护(如Python的`threading.Lock`),否则可能因并发访问导致数据损坏。 - **恢复策略**: - 轻量级:仅记录日志或上报事件(如引用[1]的hiview插件平台)[^1]。 - 重量级:重启线程或整个应用(类似Android看门狗[^3])。 - **性能影响**:看门狗线程应低优先级,避免成为瓶颈。心跳间隔不宜过短(如不低于0.5秒)。 - **平台差异**: - 在Linux/Unix系统,可直接使用定时器信号(如`signal.alarm`),但多线程环境下推荐上述方法[^2]。 - 在Android或OpenHarmony,应用层实现需注意系统限制,避免与系统看门狗冲突[^1][^4]。 #### 4. **潜在问题与优化** - **虚假超时**:如果任务本身耗时较长,需调整阈值或使用增量心跳(例如,任务分阶段更新心跳)。 - **资源泄漏**:线程重启时确保清理资源(如关闭文件句柄)。 - **扩展性**:对于大量线程,使用线程池管理,并优化检查算法(时间复杂度$O(n)$)。 - 参考引用[3],看门狗可用于监控关键服务线程,如网络请求或数据库操作[^3]。 通过以上方法,您可以在应用层高效实现多线程看门狗功能。如果需要完整代码或针对特定语言的实现(如Java或C++),请提供更多细节。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值