Crash

一、Crash文件结构

当程序运行Crash的时候,系统会把运行的最后时刻的运行信息记录下来,存储到一个文件中,也就是我们所说的Crash文件。iOS的Crash日志通常由以下6各部分组成。

1、Process Information(进程信息)

230718553901251.png

Incident Idnetifier-崩溃报告的唯一标识符,不同的Crash

CrashReporter Key-设备标识相对应的唯一键值(并非真正的设备的UDID,苹果为了保护用户隐私iOS6以后已经无法获取)。通常同一个设备上同一版本的App发生Crash时,该值都是一样的。

Hardware Model-代表发生Crash的设备类型,上图中的“iPad4,4”代表iPad Air

Process-代表Crash的进程名称,通常都是我们的App的名字, []里面是当时进程的ID

Path-可执行程序在手机上的存储位置,注意路径时到XXX.app/XXX,XXX.app其实是作为一个Bundle的,真正的可执行文件其实是Bundle里面的XXX,感兴趣的可以自己查一下相关资料,有机会我后面也会介绍到

Identifier-你的App的Indentifier,通常为“com.xxx.yyy”,xxx代表你们公司的域名,yyy代表某一个App

Version-当前App的版本号,由Info.plist中的两个字段组成,CFBundleShortVersionString and CFBundleVersion

Code Type-当前App的CPU架构

Parent Process-当前进程的父进程,由于iOS中App通常都是单进程的,一般父进程都是launchd

2、Basic Information

052025393435295.png

Date/Time-Crash发生的时间,可读的字符串

OS Version-系统版本,()内的数字代表的时Bulid号

Report Version-Crash日志的格式,目前基本上都是104,不同的version里面包含的字段可能有不同

3、Exception(非常重要)

052029230317758.png

Exception Type-异常类型

Exception Subtype-异常子类型

Crashed Thread-发生异常的线程号

4、Thread Backtrace

052034366876268.png

发生Crash的线程的Crash调用栈,从上到下分别代表调用顺序,最上面的一个表示抛出异常的位置,依次往下可以看到API的调用顺序。上图的信息表明本次Crash出现xxxViewController的323行,出错的函数调用为orderCountLoadFailed。

5、Thread State

052036460005028.png

Crash时发生时刻,线程的状态,通常我们根据Crash栈即可获取到相关信息,这部分一般不用关心。

6、Binary Images

052038193591674.png

Crash时刻App加载的所有的库,其中第一行是Crash发生时我们App可执行文件的信息,可以看出为armv7,可执行文件的包得uuid位c0f……cd65,解析Crash的时候dsym文件的uuid必须和这个一样才能完成Crash的符号化解析。

二、常见的Crash类型

1、Watchdog timeout

Exception Code:0x8badf00d, 不太直观,可以读成“eat bad food”,意思是don‘t block main thread

紧接着下面会有一段描述:

1
2
Application Specific Information:
com.xxx.yyy   failed to resume  in  time

对于此类Crash,我们应该去审视自己App初始化时做的事情是否正确,是否在主线程请求了网络,或者其他耗时的事情卡住了正常初始化流程。

通常系统允许一个App从启动到可以相应用户事件的时间最多为5S,如果超过了5S,App就会被系统终止掉。在Launch,resume,suspend,quit时都会有相应的时间要求。在Highlight Thread里面我们可以看到被终止时调用到的位置,xxxAppDelegate加上行号。

PS. 在连接Xcode调试时为了便于调试,系统会暂时禁用掉Watchdog,所以此类问题的发现需要使用正常的启动模式。

2、User force-quit

1
Exception Codes: 0xdeadfa11, deadfall

这个强制退出跟我们平时所说的kill掉后台任务操作还不太一样,通常在程序bug造成系统无法响应时可以采用长按电源键,当屏幕出现关机确认画面时按下Home键即可关闭当前程序。

3、Low Memory termination

跟一般的Crash结构不太一样,通常有Free pages,Wired Pages,Purgeable pages,largest process 组成,同事会列出当前时刻系统运行所有进程的信息。

关于Memory warning可以参看我之前写的一篇文章IOS 内存警告 Memory warning level

App在运行过程中,系统内存紧张时通常会先发警告,同时把后台挂起的程序终止掉,最终如果还是内存不够的话就会终止掉当前前台的进程。

当接受到内存警告的事后,我们应该释放尽可能多的内存,Crash其实也可以看做是对App的一种保护。

4、Crash due to bugs

因为程序bug导致的Crash通常千奇百怪,很难一概而论。大部分情况通过Crash日志就可以定位出问题,当然也不排除部分疑难杂症看半天都不值问题出在哪儿。这个就只能看功底了,一点点找,总是能发现蛛丝马迹。是在看不出来时还可以求助于Google大神,总有人遇到和你一样的Bug

三、常见的Exception Type & Exception Code

1、Exception Type

1)EXC_BAD_ACCESS

此类型的Excpetion是我们最长碰到的Crash,通常用于访问了不改访问的内存导致。一般EXC_BAD_ACCESS后面的"()"还会带有补充信息。

SIGSEGV: 通常由于重复释放对象导致,这种类型在切换了ARC以后应该已经很少见到了。

SIGABRT:  收到Abort信号退出,通常Foundation库中的容器为了保护状态正常会做一些检测,例如插入nil到数组中等会遇到此类错误。

SEGV:(Segmentation  Violation),代表无效内存地址,比如空指针,未初始化指针,栈溢出等;

SIGBUS:总线错误,与 SIGSEGV 不同的是,SIGSEGV 访问的是无效地址,而 SIGBUS 访问的是有效地址,但总线访问异常(如地址对齐问题)

SIGILL:尝试执行非法的指令,可能不被识别或者没有权限

2)EXC_BAD_INSTRUCTION

此类异常通常由于线程执行非法指令导致

3)EXC_ARITHMETIC

除零错误会抛出此类异常

2、Exception Code

0xbaaaaaad 此种类型的log意味着该Crash log并非一个真正的Crash,它仅仅只是包含了整个系统某一时刻的运行状态。通常可以通过同时按Home键和音量键,可能由于用户不小心触发

0xbad22222当VOIP程序在后台太过频繁的激活时,系统可能会终止此类程序

0x8badf00d这个前面已经介绍了,程序启动或者恢复时间过长被watch dog终止

0xc00010ff程序执行大量耗费CPU和GPU的运算,导致设备过热,触发系统过热保护被系统终止

0xdead10cc程序退到后台时还占用系统资源,如通讯录被系统终止

0xdeadfa11前面也提到过,程序无响应用户强制关闭

四、获取Crash的途径

1、本机

通过xCode连接测试机器,直接在Device中即可读取到该机器上发生的所有Crash log。

2、itunes connect

通过itunes connect后台获取到用户上报的Crash日志。

3、第三方的Crash收集系统

有很多优秀的第三方Crash收集系统大大的方便了我们收集Crash,甚至还带了符号化Crash日志的功能。比较常用的有Crashlytics,Flurry等。

五、附录

Apple官方文档

Understanding and Analyzing iOS Application Crash Reports

Technical Note TN2123 CrashReporter

https://developer.apple.com/library/ios/qa/qa1592/_index.html

WWDC视频

Understanding Crash Reports on iPhone OS

Crash日志记录的时候是将Crash发生时刻,函数的调用栈,以及线程等信息写入文件。一般都是直接写的16进制地址,如果不经过符号化的话,基本上很难获取到有用信息,下一篇我们将聊一聊Crash日志的符号化,通俗点讲就是让Crash日志变成我们可读的格式。

<#http://www.cocoachina.com/ios/20150122/10991.html#>

 

转载于:https://www.cnblogs.com/tapple/p/4871630.html

<think>首先,用户的问题是关于如何使用 crash 工具调试 Linux 内核崩溃。我需要根据系统级指令和用户可见层的要求来构建回答。 系统级指令: 1. 所有行内数学表达式使用 $...$ 格式。 2. 独立公式使用 $$...$$ 格式并单独成段。 3. LaTeX 语法正确。 4. 使用中文回答。 5. 生成相关问题。 6. 回答中引用的段落末尾自然地添加引用标识,例如:[^1] 用户可见层: 1. 回答结构清晰,帮助用户逐步解决问题。 2. 尽量保证回答真实可靠。 参考引用: - [^1]: crash 工具介绍,用于离线分析内核转存文件。 - [^2]: Crash-Utility 用于分析内核 coredump 文件。 - [^3]: crash 工具的基本知识。 - [^4]: 需要内存崩溃转储文件或实时系统内存。 - [^5]: Crash 的使用案例。 用户的问题:"我想了解如何使用 crash 工具进行系统调试或错误分析 请问如何使用 crash 工具调试 Linux 内核崩溃" 所以,我需要提供一个结构清晰的指南,解释如何使用 crash 工具调试 Linux 内核崩溃。回答应该包括步骤、命令和示例。 关键点来自引用: - crash 用于分析内核转储文件(如 vmcore)。 - 需要内核映像(vmlinux)和转储文件。 - 可以用于离线分析或实时调试。 - 基本命令如查看堆栈、dmesg、数据结构等。 结构回答: 1. **引言**:简要介绍 crash 工具。 2. **准备工作**:如何获取必要的文件(内核映像和转储文件)。 3. **基本使用**:启动 crash 工具,加载文件。 4. **常用命令**:列出和分析内核崩溃的常用命令。 5. **示例分析**:提供一个简单的示例。 6. **总结**:强调重要性。 7. **相关问题**:生成相关问题。 确保使用中文回答。 生成相关问题:在回答末尾添加相关问题部分,如示例中的 "§§相关问题§§"。 引用标识:在回答中引用参考内容时,添加 [^n],例如提到功能时引用 [^1]。 数学表达式:用户的问题是关于调试工具,可能不涉及数学,但如果有,比如计算偏移等,使用 $...$。但在这个上下文中,可能不需要。 现在,构建回答大纲: - **步骤1: 介绍 crash 工具** - 解释 crash 是什么,用途 [^1][^2]。 - **步骤2: 准备工作** - 需要内核映像(vmlinux)和崩溃转储文件(vmcore)[^4]。 - 如何生成这些文件(使用 kdump 等)。 - **步骤3: 启动 crash** - 命令格式:`crash /path/to/vmlinux /path/to/vmcore` 或实时调试 `crash` [^4]。 - **步骤4: 基本命令** - `bt`:查看堆栈回溯。 - `log`:查看 dmesg 日志。 - `struct`:查看内核数据结构。 - `dis`:反汇编。 - 其他命令如 `ps`, `files` 等 [^2][^3]。 - **步骤5: 调试示例** - 假设一个崩溃场景,展示如何分析。 - **步骤6: 总结** - 强调 crash 的强大功能 [^3]。 - **相关问题** - 生成 3-4 个相关问题。 确保语言专业、清晰。</think>### 如何使用 crash 工具调试 Linux 内核崩溃 Linux 内核崩溃(如 panic 或 oops)是严重的系统错误,可能导致系统宕机。为了快速定位问题,可以使用 crash 工具——一个强大的开源工具,专门用于分析内核崩溃生成的转储文件(如 vmcore)。它整合了 gdb 功能,支持离线分析转储文件或实时调试运行时系统 [^1][^2]。以下我将逐步解释如何使用 crash 工具进行调试,确保回答基于可靠参考和实际实践。整个过程包括准备工作、启动工具、使用命令和分析示例。 #### 1. **准备工作:获取必要文件** 在调试前,需要两个关键文件: - **内核映像文件 (vmlinux)**:这是未压缩的内核符号文件,包含调试信息。通常位于 `/usr/lib/debug/lib/modules/$(uname -r)/vmlinux` 或编译内核时生成的路径。 - **崩溃转储文件 (vmcore)**:当内核崩溃时,通过 kdump 机制自动生成。确保 kdump 已启用: - 安装 kdump-tools:`sudo apt-get install kdump-tools`(Ubuntu)或 `sudo yum install kexec-tools`(CentOS)。 - 配置 kdump:编辑 `/etc/default/kdump-tools`,设置转储路径,然后重启服务:`sudo systemctl restart kdump-tools`。 - 崩溃后,转储文件通常保存在 `/var/crash/` 或指定目录 [^4]。 如果系统未崩溃,但需调试实时内核,crash 可直接访问 `/dev/mem` 或 `/proc/kcore`(需 root 权限)[^4]。确保文件权限正确:使用 `sudo` 或 root 用户操作。 #### 2. **启动 crash 工具** 根据场景选择启动方式: - **离线分析转储文件**:使用 vmlinux 和 vmcore 文件启动。 ```bash crash /path/to/vmlinux /path/to/vmcore ``` 例如:`crash /usr/lib/debug/boot/vmlinux-$(uname -r) /var/crash/vmcore`。 - **实时调试运行时系统**:直接运行 `crash`,它会自动加载 `/proc/kcore` 作为内存转储 [^4]。 ```bash sudo crash ``` 启动后,进入 crash 交互式命令行界面,提示符变为 `crash>`。系统会显示崩溃摘要,如 panic 原因和寄存器状态 [^2]。 #### 3. **常用命令分析内核崩溃** crash 提供多种命令来诊断问题。以下是调试崩溃的核心命令(完整列表可通过 `help` 查看): - **`bt`(backtrace)**:查看崩溃时的堆栈回溯。这是第一步,用于定位触发崩溃的函数调用链。 ``` crash> bt ``` 输出显示每个 CPU 的堆栈帧,帮助识别错误源头 [^2]。 - **`log` 或 `dmesg`**:查看内核日志(dmesg),包含崩溃前后的错误消息。 ``` crash> log ``` 例如,搜索 "panic" 或 "Oops" 关键字,确定崩溃原因 [^1]。 - **`struct`**:检查内核数据结构。例如,分析任务结构 `task_struct` 以查看进程状态。 ``` crash> struct task_struct comm ``` 参数可指定字段(如 `comm` 表示进程名),辅助诊断资源泄漏或竞争条件 [^3]。 - **`dis`(disassemble)**:反汇编代码,分析汇编指令错误。 ``` crash> dis <function_name> ``` 例如:`dis sys_write`,检查函数实现是否有问题 [^1]。 - **`ps`**:列出所有进程状态,识别崩溃时活跃的进程。 ``` crash> ps ``` - **`kmem`**:分析内存使用,检测内存损坏或泄漏。 ``` crash> kmem -i ``` 显示内存统计信息,如分配和释放情况 [^3]。 - **`search`**:搜索内存中的特定值或字符串。 ``` crash> search -u <address> ``` 例如,搜索崩溃地址以关联数据。 这些命令可组合使用。例如,先 `bt` 找到问题函数,再 `struct` 检查相关数据结构,最后 `dis` 反汇编代码 [^2][^3]。 #### 4. **调试示例:分析一个简单崩溃** 假设系统因 NULL 指针解引用崩溃,dmesg 显示 "Unable to handle kernel NULL pointer dereference"。以下是分析步骤: 1. 启动 crash:`crash /path/to/vmlinux /path/to/vmcore`。 2. 查看堆栈回溯: ``` crash> bt PID: 0 TASK: ffff888007c00000 CPU: 0 COMMAND: "swapper/0" #0 [ffff888007c03df0] panic at ffffffff810e2345 #1 [ffff888007c03e50] oops_end at ffffffff81f0d7d3 #2 [ffff888007c03e80] no_context at ffffffff81f0b4a2 #3 [ffff888007c03ed0] __bad_area_nosemaphore at ffffffff81f0b5c1 #4 [ffff888007c03f20] bad_area at ffffffff81f0b7d0 #5 [ffff888007c03f50] __do_page_fault at ffffffff8100a8b0 #6 [ffff888007c03fa0] do_page_fault at ffffffff81f0c3a5 #7 [ffff888007c03fd0] page_fault at ffffffff82000bf5 ``` 输出显示 `panic` 由 `do_page_fault` 触发,表明内存访问错误。 3. 检查日志确认: ``` crash> log | grep panic Kernel panic - not syncing: Fatal exception ``` 4. 分析问题函数:假设 `bt` 指向 `my_driver_write` 函数,使用 `dis` 反汇编: ``` crash> dis my_driver_write 0xffffffffa0000000 <my_driver_write>: push %rbp 0xffffffffa0000001 <my_driver_write+1>: mov %rsp,%rbp 0xffffffffa0000004 <my_driver_write+4>: mov 0x10(%rdi),%rax # 访问 NULL 指针 ``` 反汇编显示指令 `mov 0x10(%rdi),%rax` 尝试访问无效地址。 5. 检查数据结构:使用 `struct` 查看 `rdi` 寄存器对应的结构。 ``` crash> struct file f_path.dentry @rdi ``` 输出可能显示 `dentry` 为 NULL,证实 NULL 指针解引用。 通过此过程,可定位到驱动代码中的 bug,并修复访问检查逻辑 [^2][^3]。 #### 5. **总结** crash 工具是 Linux 内核调试的核心利器,能高效分析转储文件或实时系统,帮助开发者快速诊断崩溃原因(如内存错误、竞争条件或驱动问题)。它整合了堆栈、日志和数据结构检查,减少调试时间 [^1][^3]。实践中,建议结合内核文档和社区资源(如 kernel.org)深入学习。记住:调试需 root 权限,确保文件路径正确以避免错误。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值