如何定位Kinetis MCU Hard Fault 异常 (amobbs.com 阿莫电子技术论坛) -

FSL_FSL_chao 发表于 2014-12-31 12:52:29

如何定位Kinetis MCU Hard Fault 异常

本帖最后由 FSL_FSL_chao 于 2014-12-31 13:17 编辑

   Kinetis MCU 采用 Cortex-M4 的内核，该内核的 Fault 异常可以捕获非法的内存访问和非法的编程行为。Fault 异常能够检测到以下几类非法行为：
• 总线 Fault:在取址、数据读/写、取中断变量、进入/退出中断时寄存器堆栈操作（入栈/出栈）时检测到内存访问错误。
• 存储器管理 Fault: 检测到内存访问违反了内存保护单元（MPU, Memory Protection Unit）定义的区域。
• 用法 Fault:检测到未定义的指令异常，未对其的多重加载/存储内存访问。如果使能相应控制位，还可以检测出除数为零以及其他未对齐的内存访问。
• 硬 Fault:如果上述的总线 Fault、存储器管理 Fault、用法 Fault 的处理程序不能被执行（例如禁能了总线 Fault、存储器管理 Fault、用法 Fault 的异常或者在这些异常处理程序中又出现了新的 Fault）则触发硬 Fault。
   在 MQX 操作系统启动的时候会安装上默认的异常中断处理函数，当系统异常时会产生一个“unexpected”中断，内核就会自动调用异常处理函数，同时也将运行用户自定义的处理函数，来实现特殊故障的定位方法。
   默认情况下，MQX 把出现异常的任务挂起，避免故障进一步扩大。通过 TAD 任务感知调试插件的 Task summary 功能，我们可以观察到出现异常的任务情况。

   开发人员在调试期间，需要弄清楚系统异常触发了哪类 Fault，由什么原因触发了 Fault 以及定位触发 Fault 的代码。在这种情况下，可以利用自定义的 Fault 中断处理程序来分析
Fault 出错原因。
为了解释所述的 Fault 中断处理程序的原理，这里重述一下当系统产生异常时 MCU 的处理过程:
• 有一个压栈的过程，若产生异常时使用 PSP（进程栈指针），就压入到 PSP 中，若产生异常时使用 MSP（主栈指针），就压入 MSP 中。
• 会根据处理器的模式和使用的堆栈，设置 LR 的值（当然设置完的 LR 的值再压栈）。
• 异常保存，硬件自动把 8 个寄存器的值压入堆栈（8 个寄存器依次为 xPSR、PC、LR、R12以及 R3~R0）。如果异常发生时，当前的代码正在使用 PSP，则上面 8 个寄存器压入 PSP; 否则就压入 MSP。
   当系统产生异常时，我们需要两个关键寄存器值，一个是 PC ，一个是 LR （链接寄存
器），通过 LR 找到相应的堆栈，再通过堆栈找到触发异常的 PC 值。将产生异常时压入栈
的 PC 值取出，并与反汇编的代码对比就能得到哪条指令产生了异常。
   这里解释一下关于 LR 寄存器的工作原理。如上所述，当 Cortex-M4 处理器接受了一个异常后，寄存器组中的一些寄存器值会被自动压入当前栈空间里，这其中就包括链接寄存器（LR ）。这时的 LR 会被更新为异常返回时需要使用的特殊值（EXC_RETURN）。关于EXC_RETURN 的定义如下，其为 32 位数值，高 28 位置 1，第 0 位到第三位则提供了异常返回机制所需的信息，如下表所示。可见其中第 2 位标示着进入异常前使用的栈是 MSP还是 PSP。在异常处理过程结束时，MCU 需要根据该值来分配 SP 的值。这也是本方法中用来判断所使用堆栈的原理，其实现方法可以从后面_init_hardfault_isr 中看到。

另外，我们可以利用 MQX 的控制台串口输出 Fault 异常信息来帮助调试。编写 Fault 处理程序时，将启动代码中默认的 Fault 处理程序跟换成自己需要的 Fault 处理程序。需要注意的是，由于是在中断中进行打印输出，MQX 的控制台串口只能使用 POLL 轮询模式的驱动，不能使用中断模式的驱动。
用户可以编写自定义的硬 Fault 处理程序_int_hardfault_isr，修改 MQX 的中断向量定义vector.c，把里面的 DEFAULT_VECTOR 代码段换成下面的代码。当系统出现硬 Fault 异常时，将会调用自定义的 Fault 处理_int_hardfault_isr 函数。在这个函数，我们可以通过Stack Trace-back 回溯出现问题的代码。

我们可以在_int_hardfault_isr 函数里将出现异常时的寄存器、堆栈、状态寄存器等信息打印出来。如果系统出现异常时，一般情况都会通过串口控制台打印出 LR，PC 的值。然后根据编译器生成的 map 文件，找到出现问题的具体函数。

从上图的串口输出我们可以看到 PC 和 LR 寄存器值，PC 的值为 0x56c6，我们根据汇编代码可以找到出现问题的指令。从而大大缩小了查找出现问题的范围，可以帮助开发人员快速定位问题的根本原因。
附录Fault异常中断处理代码：
// hard fault handler in C,
// with stack frame location as input parameter
void hard_fault_handler_c (unsigned int * hardfault_args)
{
unsigned int stacked_r0;
unsigned int stacked_r1;
unsigned int stacked_r2;
unsigned int stacked_r3;
unsigned int stacked_r12;
unsigned int stacked_lr;
unsigned int stacked_pc;
unsigned int stacked_psr;

stacked_r0 = ((unsigned long) hardfault_args);
stacked_r1 = ((unsigned long) hardfault_args);
stacked_r2 = ((unsigned long) hardfault_args);
stacked_r3 = ((unsigned long) hardfault_args);

stacked_r12 = ((unsigned long) hardfault_args);
stacked_lr = ((unsigned long) hardfault_args);
stacked_pc = ((unsigned long) hardfault_args);
stacked_psr = ((unsigned long) hardfault_args);

printf ("\n\n\n");
printf ("R0 = %x\n", stacked_r0);
printf ("R1 = %x\n", stacked_r1);
printf ("R2 = %x\n", stacked_r2);
printf ("R3 = %x\n", stacked_r3);
printf ("R12 = %x\n", stacked_r12);
printf ("LR = %xsubroutine call return address\n", stacked_lr);
printf ("PC = %xprogram counter\n", stacked_pc);
printf ("PSR = %x\n", stacked_psr);

/******************* Add your debug trace here ***********************/
_int_kernel_isr();
}

/* hard fault interrupt handler */
void _int_hardfault_isr( )
{
__asm("TST LR, #4");
__asm("ITE EQ");
__asm("MRSEQ R0, MSP");
__asm("MRSNE R0, PSP");
__asm("B hard_fault_handler_c");
}
(by Shaozhong Liang--FAE IMM China)

jiwx2011 发表于 2014-12-31 12:57:59

首发，果断收藏了

fengyunyu 发表于 2014-12-31 12:59:43

Hard Fault，在项目初期经常碰到，收藏！

Ray______ 发表于 2015-1-19 00:45:28

很好用，很容易发现错误在哪

页: [1]

amobbs.com 阿莫电子技术论坛's Archiver

如何定位Kinetis MCU Hard Fault 异常