Linux程序内存越界定位分析杂谈2

转一些知乎大佬的方法

原网页

1.

解决各种内存相关问题(例如内存泄漏,内存被踩坏等),。简单来说就一句话修改tcmalloc,加入audit信息。具体修改包括如下2个方面:
1.在每次分配的时候,多申请12个字节,用于记录分配者的线程ID,栈ID,本次操作是分配还是释放的标志位,分配时间等信息。
2.在tcmalloc 上外挂了一个ringbuffer, 每次内存分配的时候记录下地址信息,线程ID,栈ID,长度,申请还是释放标志位
额外占用的内存其实很小。
对于题主说的内存被踩坏的情况,按照我们的经验,大多数都是野指针导致的,遇到后分析core文件,在ringbuffer中查找这个地址的前几代分配释放记录就一目了然了 2. libsigsegv

除了常见的内存排错工具,比如ASAN,valgind

另外一个值得介绍的就是mprotect大法。。


中心思想就是,当别人写到不该它写的内容的时候,我们让操作系统通知我们。

linux 里提供了一个函数

int mprotect(const void *addr, size_t len, int prot);


其中 addr 得是按页对齐的地址,len 得是页面的整数倍,


最后一个参数是你要给的权限

可以是 PROT_READ (只读)

也可以是 PROT_WRITE (只写)

还可以是 PROT_WRITE | PROT_READ (可读可写)


一般来说,我们通过 获取的内存呢都是可读可写的,mprotect可以让指定的n个页面变成只读,这个时候是一旦有人写了,就会发出一个SIGSEGV 信号,


也就是分配内存的时候上保护,需要写的时候去保护 写完以后再上保护。


比如

void* start_addess = mmap(NULL,PROT_READ | PROT_WRITE,getpagesize(),0,0);
//老板,来一个页!
//...
//... 对这个页做一些羞羞的事
//...

//告诉你们这个页只能老子写进去!然而老子已经写进去了!谁都不许动!
mprotect(start_address, getpagesize(), PROT_READ);

//这样当别的进程一碰这个页,程序立刻SIGSEGV,世界在这一天毁灭了。

好了,下面简单说一下怎么处理这个SIGSEGV,

简单来说就是用libsigsegv

libsigsegv - GNU Project


libsigsegv 提供了 sigsegv_install_handler 函数,简单来说就是让你注册一个callback 当发生SIGSEGV的时候,控制流就会进入你的callback,然后你在这个callback里backtrace,自然就知道谁是那个干坏事儿的人了。瞬间真相大白。



是啊,mprotect简直是坠吼的,但是吧,也有些问题,你看你必须得是mmap这样获取的按页对齐的内存地址,但是一般来说我们都会用malloc,然而malloc给出的地址往往不是按页对齐的,这个时候怎么办呢。 简单,你可以自己写个malloc,里面用mmap直接拿到页,一拿就是整页个,结构体不管多大一律按页对齐,但是这样会造成内存浪费,所以我们加个宏,需要debug的时候呢,用我们这个malloc,以及那些mprotect逻辑,relase的时候切换回去。


这样一旦发生野指针就切换成我们的malloc,找到问题干掉,切换回去也不会有问题了。

上一篇:OGG 的初始化加载


下一篇:XML和DOM