memcache(三)内存管理

memcached(三)内存管理

memcached使用预申请的方式来管理内存的分配,从而避免内存碎片化的问题。如果采用mallo和free来动态的申请和销毁内存,必然会产生大量的内存碎片。

基本知识

slab:内存块是memcached一次申请内存的最小单元,在memcached中一个slab的默认大小为1M;

slabclass:特定大小的chunk的组。

chunk:缓存的内存空间,一个slab被划分为若干个chunk;

item:存储数据的最小单元,每一个chunk都会包含一个item;

factor:增长因子,默认为1.25,相邻slab中的item大小与factor成比例关系;

基本原理

memcached使用预分配方法,避免频繁的调用malloc和free;

memcached通过不同的slab来管理不同chunk大小的内存块,从而满足存储不同大小的数据。

slab的申请是通过在使用item时申请slab大小的内存空间,然后再把内存切割为大小相同的item,挂在到slab的未使用链表上。

过期和被删除item并不会被free掉,memcached并不会删除已经分配的内存;

Memcached会优先使用已超时的记录空间,通过LRU算法;

memcached使用lazy expiration来判断元素是否过期,所以过期监视上不会占用cpu时间。

源码分析

下面主要分析memcached的内存申请和存储相关代码。

item

item是key/value的存储单元。

typedef struct _stritem {
struct _stritem *next; /* 前后指针用于在链表slab->slots中连接前后数据 */
struct _stritem *prev;
struct _stritem *h_next; /* hash chain next */
rel_time_t time; /* 最后一次访问时间 */
rel_time_t exptime; /* 过期时间 */
int nbytes; /* 数据大小 */
unsigned short refcount; /* 引用次数 */
uint8_t nsuffix; /* suffix长度 */
uint8_t it_flags; /* ITEM_* above */
uint8_t slabs_clsid;/* 所有slab的id */
uint8_t nkey; /* key长度 */
/* this odd type prevents type-punning issues when we do
* the little shuffle to save space when not using CAS. */
union {
uint64_t cas;
char end;
} data[]; /* cas|key|suffix|value */
} item;

slab初始化

void slabs_init(const size_t limit, const double factor, const bool prealloc) {
int i = POWER_SMALLEST - ;
unsigned int size = sizeof(item) + settings.chunk_size; /* 得到每一个item的大小 */ mem_limit = limit; if (prealloc) { /* 预分配一块内存 */
...
} memset(slabclass, , sizeof(slabclass)); /* 把slabclass置为0,slabclass是一个slab数组,存储所有slab的信息 */ while (++i < POWER_LARGEST && size <= settings.item_size_max / factor) { /* 循环初始化每一个slab的内容,保证slab中item的size小于max_size/factor */
/* Make sure items are always n-byte aligned */
if (size % CHUNK_ALIGN_BYTES) /* 用于内存对齐 */
size += CHUNK_ALIGN_BYTES - (size % CHUNK_ALIGN_BYTES); slabclass[i].size = size; /* 初始化slabclass中item的大小 */
slabclass[i].perslab = settings.item_size_max / slabclass[i].size; /* 初始化每个slab中item的数量 */
size *= factor; /* item的大小随factor逐渐增大 */
...
}
/* 初始化最后一个slab,大小为最大的max_size,只有一个item */
power_largest = i;
slabclass[power_largest].size = settings.item_size_max;
slabclass[power_largest].perslab = ;
...
}

从源码中,可以看出来同一个slab中所有的item的大小都是固定的,

申请slab内存

static void *do_slabs_alloc(const size_t size, unsigned int id) {
slabclass_t *p;
void *ret = NULL;
item *it = NULL; if (id < POWER_SMALLEST || id > power_largest) { /* 判断id是否合法 */
MEMCACHED_SLABS_ALLOCATE_FAILED(size, );
return NULL;
} p = &slabclass[id]; /* 获取slab */
assert(p->sl_curr == || ((item *)p->slots)->slabs_clsid == ); /* fail unless we have space at the end of a recently allocated page,
we have something on our freelist, or we could allocate a new page */
if (! (p->sl_curr != || do_slabs_newslab(id) != )) { /*如果sl_curr为0,没有剩余的item,那么就执行do_slabs_newslab申请内存空间*/
/* We don't have more memory available */
ret = NULL;
} else if (p->sl_curr != ) { /* 如果有未使用的空间,则获取该item,并从slots链表中删除该item */
/* return off our freelist */
it = (item *)p->slots;
p->slots = it->next;
if (it->next) it->next->prev = ;
p->sl_curr--;
ret = (void *)it;
}
...
return ret;
}

sl_curr来判断是否存在未使用的内容空间,如果不存在需要调用do_slabs_newslab来申请slab空间。

static int do_slabs_newslab(const unsigned int id) {
slabclass_t *p = &slabclass[id];
int len = settings.slab_reassign ? settings.item_size_max
: p->size * p->perslab;
char *ptr;
/* 1. 判断是否超过内存限制
2. 判断是否申请过内存空间
3. 如果没有申请过,则申请slab->size*slab->perslab大小的整块内存
4.如果申请过,调用grow_slab_list来扩大slab大小 */
if ((mem_limit && mem_malloced + len > mem_limit && p->slabs > 0) ||
(grow_slab_list(id) == 0) ||
((ptr = memory_allocate((size_t)len)) == 0)) { MEMCACHED_SLABS_SLABCLASS_ALLOCATE_FAILED(id);
return 0;
} memset(ptr, 0, (size_t)len);
split_slab_page_into_freelist(ptr, id); /* 把申请的内存分配到slots链表中 */ p->slab_list[p->slabs++] = ptr;
mem_malloced += len;
MEMCACHED_SLABS_SLABCLASS_ALLOCATE(id); return ;
}

申请空间后,需要通过split_slab_page_into_freelist函数把申请的内存空间分配到未使用的链表中。

static void split_slab_page_into_freelist(char *ptr, const unsigned int id) {
slabclass_t *p = &slabclass[id];
int x;
for (x = ; x < p->perslab; x++) { /* 循环分配内存 */
do_slabs_free(ptr, , id);
ptr += p->size;
}
} static void do_slabs_free(void *ptr, const size_t size, unsigned int id) {
slabclass_t *p;
item *it;
...
p = &slabclass[id];
/* 获取内存指针,把item块挂在到slots链表中,增加sl_curr */
it = (item *)ptr;
it->it_flags |= ITEM_SLABBED;
it->prev = ;
it->next = p->slots;
if (it->next) it->next->prev = it;
p->slots = it; p->sl_curr++;
p->requested -= size;
return;
}

获取适当大小的item

在do_item_alloc中,调用了slabs_clsid来获取适合存储当前元素的slab id。

unsigned int slabs_clsid(const size_t size) {
int res = POWER_SMALLEST; if (size == )
return ;
while (size > slabclass[res].size) /* 遍历slabclass来找到适合size的item */
if (res++ == power_largest) /* won't fit in the biggest slab */
return ;
return res;
}

优缺点

内存预分配可以避免内存碎片以及避免动态分配造成的开销。

内存分配是由冗余的,当一个slab不能被它所拥有的chunk大小整除时,slab尾部剩余的空间就会被丢弃。

由于分配的是特定长度的内存,因此无法有效地利用所有分配的内存,例如如果将100字节的数据存储在128字节的chunk中,会造成28字节的浪费。

上一篇:Atitit  ocr识别原理 与概论 attilax总结


下一篇:Java虚拟机工作原理详解 (一)