Linux内核:通知链 机制
背景
在驱动分析中经常看到fb_notifier_callback
,现在趁有空学习一下。
参考:
- https://www.cnblogs.com/armlinux/archive/2011/11/11/2396782.html
- https://www.cnblogs.com/armlinux/archive/2011/11/11/2396781.html
- http://blog.chinaunix.net/uid-23069658-id-4360706.html
- http://blog.chinaunix.net/uid/23069658/year-201407-list-1.html
概念
大多数内核子系统都是相互独立的,因此某个子系统可能对其它子系统产生的事件感兴趣。为了满足这个需求,也即是让某个子系统在发生某个事件时通知其它的子系统,Linux内核提供了通知链的机制。通知链表只能够在内核的子系统之间使用,而不能够在内核与用户空间之间进行事件的通知。 通知链表是一个函数链表,链表上的每一个节点都注册了一个函数。当某个事情发生时,链表上所有节点对应的函数就会被执行。所以对于通知链表来说有一个通知方与一个接收方。在通知这个事件时所运行的函数由被通知方决定,实际上也即是被通知方注册了某个函数,在发生某个事件时这些函数就得到执行。
其实通知链和系统调用signal的思想差不多。
先考虑这么一种场景:
对于网卡驱动子系统来说,经常会发生的情况就是什么?网卡IP地址有变化,网卡状态有变化等等。
那么如果有其他子系统,比如路由子系统最网卡IP地址变化这件事比较感兴趣,它该怎么去感知这件事儿呢?
通知链机制可以算作是“订阅者-发布者”模型的一种。
每个子系统都会有些一些重要事件,例如前面说的,网络驱动子系统网卡的事件,或者USB的状态事件等等;
这些子系统都会提供一个自己的事件队列,这个队列都是其他函数提供的回调函数:当有事件发生时,子系统就会去遍历其事件队列上已经注册了的所有回调函数,这样就实现了“通知”的目的。
通知链的原型就是一条单向链表,内核提供的通知链机制主要用于不同子系统之间通信,基于事件和优先级。
这部分是由协议栈头号大Boss----
@Alan Cox
亲自主刀,足以说明这个基础特性的重要性,也有很多值得我们学习的地方。
数据结构
不同类型的通知链
Linux内核提供了三类通知链:原子通知链、阻塞通知链和原始通知链,它们的主要区别就是在执行通知链上的回调函数时是否有安全保护措施。
原子通知链
原子通知链( Atomic notifier chains ):通知链元素的回调函数(当事件发生时要执行的函数)只能在中断上下文中运行,不允许阻塞。对应的链表头结构:
struct atomic_notifier_head
{
spinlock_t lock;
struct notifier_block *head;
};
可阻塞通知链
可阻塞的通知链有两种类型,一种用信号量实现回调函数的加锁,另一种是采用互斥锁和叫做“可睡眠的读拷贝更新机制”(Sleepable Read-Copy UpdateSleepable Read-Copy Update)。
可阻塞型的通知链运行在进程空间的上下文环境里。
可阻塞通知链( Blocking notifier chains ):通知链元素的回调函数在进程上下文中运行,允许阻塞。对应的链表头:
struct blocking_notifier_head
{
struct rw_semaphore rwsem;
struct notifier_block *head;
};
SRCU 通知链( SRCU notifier chains ):可阻塞通知链的一种变体。对应的链表头:
struct srcu_notifier_head
{
struct mutex mutex;
struct srcu_struct srcu;
struct notifier_block *head;
};
原始通知链
原始通知链( Raw notifier chains ):对通知链元素的回调函数没有任何限制,所有锁和保护机制都由调用者维护。对应的链表头:
struct raw_notifier_head
{
struct notifier_block *head;
};
核心结构
通知链的核心结构:
struct notifier_block
{
int (*notifier_call)(struct notifier_block *, unsigned long, void *);
struct notifier_block *next;
int priority;
};
参数:
-
最重要的就是notifier_call这个函数指针,代表通知链要执行的函数指针,
-
next指向下一个回调函数的通知块
-
priority是这个通知的优先级,同一条链上的
notifier_block
是按优先级排列的。priority是事件发生时本函数(由notifier_call所指向)执行的优先级,数字越大优先级越高,越会先被执行。
内核代码中一般把通知链命名为xxx_chain, xxx_nofitier_chain这种形式的变量名。
运作机制
通知链的运作机制包括两个角色:
- 被通知者:对某一事件感兴趣一方。定义了当事件发生时,相应的处理函数,即回调函数。但需要事先将其注册到通知链中(被通知者注册的动作就是在通知链中增加一项)。
- 通知者:事件的通知者。当检测到某事件,或者本身产生事件时,通知所有对该事件感兴趣的一方事件发生。他定义了一个通知链,其中保存了每一个被通知者对事件的处理函数(回调函数)。通知这个过程实际上就是遍历通知链中的每一项,然后调用相应的事件处理函数。
包括以下过程:
1、通知者定义通知链。
2、被通知者向通知链中注册回调函数。
3、当事件发生时,通知者发出通知(执行通知链中所有元素的回调函数)。
监听通知
被通知者调用 notifier_chain_register
函数注册回调函数,该函数按照优先级将回调函数加入到通知链中:
static int notifier_chain_register(struct notifier_block **nl, struct notifier_block *n)
{
while ((*nl) != NULL)
{
if (n->priority > (*nl)->priority)
break;
nl = &((*nl)->next);
}
n->next = *nl;
rcu_assign_pointer(*nl, n);
return 0;
}
卸载通知
注销回调函数则使用 notifier_chain_unregister
函数,即将回调函数从通知链中删除:
static int notifier_chain_unregister(struct notifier_block **nl, struct notifier_block *n)
{
while ((*nl) != NULL)
{
if ((*nl) == n)
{
rcu_assign_pointer(*nl, n->next);
return 0;
}
nl = &((*nl)->next);
}
return -ENOENT;
}
通知事件
通知者调用 notifier_call_chain
函数通知事件的到达,这个函数会遍历通知链中所有的元素,然后依次调用每一个的回调函数(即完成通知动作):
static int __kprobes notifier_call_chain(struct notifier_block **nl,
unsigned long val,
void *v,
int nr_to_call,
int *nr_calls)
{
int ret = NOTIFY_DONE;
struct notifier_block *nb, *next_nb;
nb = rcu_dereference(*nl);
while (nb && nr_to_call)
{
next_nb = rcu_dereference(nb->next);
ret = nb->notifier_call(nb, val, v);
if (nr_calls)
(*nr_calls)++;
if ((ret & NOTIFY_STOP_MASK) == NOTIFY_STOP_MASK)
break;
nb = next_nb;
nr_to_call--;
}
return ret;
}
参数nl是通知链的头部,val表示事件类型,v用来指向通知链上的函数执行时需要用到的参数,一般不同的通知链,参数类型也不一样。
例如当通知一个网卡被注册时,v就指向net_device结构,nr_to_call表示准备最多通知几个,-1表示整条链都通知,nr_calls非空的话,返回通知了多少个。
每个被执行的notifier_block回调函数的返回值可能取值为以下几个:
- NOTIFY_DONE:表示对相关的事件类型不关心。
- NOTIFY_OK:顺利执行。
- NOTIFY_BAD:执行有错。
- NOTIFY_STOP:停止执行后面的回调函数。
- NOTIFY_STOP_MASK:停止执行的掩码。
notifier_call_chain()
把最后一个被调用的回调函数的返回值作为它的返回值。