Native Crash捕获原理与实践（一）

最新推荐文章于 2024-12-16 00:25:19 发布

原创

最新推荐文章于 2024-12-16 00:25:19 发布 · 2.4k 阅读

14 ·

CC 4.0 BY-SA版权

文章标签：

#android #android studio #native app #java

在Android平台，native crash一直是crash里的大头。native crash具有上下文不全、出错信息模糊、难以捕捉等特点，比java crash更难修复。

一、为什么会产生Native Crash？

常见导致Native Crash的原因有以下几种：

1. jni内部数组越界、缓冲区溢出、空指针、野指针等；

2. jni中多线程出现竞争，比如一个线程调用jni接口释放了内部一个指针，另一个线程调用另外一个jni接口还在使用这个指针；

3. Android ART发现或出现异常；

4. 其他framework、Kernel或硬件bug；

二、现有的方案

方案	优点	缺点
Google Breakpad	权威，跨平台	代码体量大
利用Logcat日志	利用Android系统实现	需要在crash时启动新进程过滤logcat日志，不可靠
coffeecatch	实现简介，改动容易	存在兼容性问题

Google breakpad是一个跨平台的崩溃转储和分析框架和工具集合，具有权威、跨平台等优点，其实现原理如下图所示。

Breakpad由三个主要组件：

client：以library的形式内置在你的应用中，当崩溃发生时写 minidump文件
symbol dumper：读取由编译器生成的调试信息（debugging information），并生成 symbol file
processor：读取 minidump文件和 symbol file ，生成可读的c/c++ Stack trace.

由于google-breakpad是夸平台开源工具，体量较大，在其基础上生成的通用so和dmp日志也都较大，对于sdk大小有严格要求的APP，可能不是很方便。Logcat日志虽然是利用Android系统实现，但是需要在crash时启动新进程过滤logcat日志，而且不可靠。因此，下面介绍一种体量较小的基于c/c++异常信号处理的NativeCrash日志收集方法，其实现原理如下图所示。