用户空间与内核的交互---NETLINK

   关于netlink,相信玩过上层开发的人并不陌生,尤其是经常穿梭于用户空间和内核之间的开发,前面我们说过在用户空间与内核空间的交互有ioctl 、proc 等,而netlink又有它独特的地位和作用.
  我开始接触netlink是开始于去实现一个恢复出厂值的按键.当然先要实现一个中断,然后再去通知上层做相应的恢复配置文件的操作,当时是参考了前辈的代码,稍作修改,才搞定,对于当时的netlink的广播消息还是相当的费解^^. 在后来就是看了《深入理解linux网络技术内幕》中有提到,但是篇幅很少,当时从网上来看,从实际的应用来看netlink不容易忽视. 
   Netlink套接字是用以实现用户进程与内核进程通信的一种特殊的进程间通信(IPC) ,也是网络应用程序与内核通信的最常用的接口。  
   Netlink套接字可以使用标准的套接字APIs来创建。socket(), bind(), sendmsg(), recvmsg() 和 close()很容易地应用到 netlink socket。
   netlink包含于头文件linux/netlink.h中.

Netlink 相对于系统调用,ioctl 以及 /proc 文件系统而言具有以下优点:

1,为了使用 netlink,用户仅需要在 include/linux/netlink.h 中增加一个新类型的 netlink 协议定义即可, 如 #define NETLINK_MYTEST 17 然后,内核和用户态应用就可以立即通过 socket API 使用该 netlink 协议类型进行数据交换。但系统调用需要增加新的系统调用,ioctl 则需要增加设备或文件, 那需要不少代码,proc 文件系统则需要在 /proc 下添加新的文件或目录,那将使本来就混乱的 /proc 更加混乱。

2. netlink是一种异步通信机制,在内核与用户态应用之间传递的消息保存在socket缓存队列中,发送消息只是把消息保存在接收者的socket的接 收队列,而不需要等待接收者收到消息,但系统调用与 ioctl 则是同步通信机制,如果传递的数据太长,将影响调度粒度。

3.使用 netlink 的内核部分可以采用模块的方式实现,使用 netlink 的应用部分和内核部分没有编译时依赖,但系统调用就有依赖,而且新的系统调用的实现必须静态地连接到内核中,它无法在模块中实现,使用新系统调用的应用在编译时需要依赖内核。

4.netlink 支持多播,内核模块或应用可以把消息多播给一个netlink组,属于该neilink 组的任何内核模块或应用都能接收到该消息,内核事件向用户态的通知机制就使用了这一特性,任何对内核事件感兴趣的应用都能收到该子系统发送的内核事件,在 后面的文章中将介绍这一机制的使用。

5.内核可以使用 netlink 首先发起会话,但系统调用和 ioctl 只能由用户应用发起调用。

6.netlink 使用标准的 socket API,因此很容易使用,但系统调用和 ioctl则需要专门的培训才能使用

 当然netlink有单播和广播之分,下面我们就先用实际例子为引导来分析:
userspace :
一个简单的应用程序:

点击(此处)折叠或打开

  1. // userspace :
  2. #include sys/stat.h>
  3. #include unistd.h>
  4. #include stdio.h>
  5. #include stdlib.h>
  6. #include sys/socket.h>
  7. #include sys/types.h>
  8. #include string.h>
  9. #include asm/types.h>
  10. #include linux/netlink.h>
  11. #include linux/socket.h>

  12. struct u_packet_info
  13. {
  14.     struct nlmsghdr hdr;
  15.     char buf[10];
  16. };

  17. #if 1
  18. int
  19. main (int argc, char **argv)
  20. {
  21.     
  22.     int fd,len1,len2;
  23.     
  24.     struct sockaddr_nl src_addr,dst_addr;
  25.     struct nlmsghdr *mymsg, mymsg2 ;
  26.     struct msghdr msg;
  27.       struct u_packet_info *info;
  28.      char *buf;

  29.     /*test my netlink :socket */
  30.     fd = socket(AF_NETLINK,SOCK_RAW,NETLINK_MYCTRL);
  31.     if(fd 0)
  32.     {
  33.         printf("create netlink_myctrl socket fail !n");
  34.         return -1;
  35.     }
  36.         memset(&src_addr,0,sizeof(src_addr));
  37.         src_addr.nl_family = AF_NETLINK;
  38.         src_addr.nl_pid = getpid();
  39.         src_addr.nl_groups = 0;

  40.     if(bind(fd,(struct sockaddr *)&src_addr,sizeof(src_addr)) != 0)
  41.     {
  42.         perror("bind errorn");
  43.         return -1;
  44.     }

  45.          memset(&dst_addr,0,sizeof(dst_addr));
  46.           dst_addr.nl_family = AF_NETLINK;
  47.         dst_addr.nl_pid = 0;
  48.         dst_addr.nl_groups = 0; //not in multicast


  49.     mymsg =(struct nlmsghdr *)malloc(NLMSG_SPACE(20));
  50.     info =(struct u_packet_info *)malloc(sizeof(struct u_packet_info ));
  51.     
  52.     mymsg->nlmsg_len = NLMSG_LENGTH(20);
  53.     mymsg->nlmsg_flags = 0;
  54.     mymsg->nlmsg_type = NETLINK_MYCTRL;
  55.     mymsg->nlmsg_pid = src_addr.nl_pid;
  56.     strcpy(NLMSG_DATA(mymsg), "Hello you!");
  57.     
  58.      memset(&msg,0,sizeof(msg));
  59.     //send to kernel
  60.     sendto(fd,mymsg,mymsg->nlmsg_len,0,(struct sockaddr *) &dst_addr,sizeof(dst_addr));

  61.     free(mymsg);

  62.    while(1)
  63.     {
  64.       len2 = sizeof(struct sockaddr_nl);
  65.       len1 = recvfrom(fd, info ,sizeof(struct u_packet_info),0,(struct sockaddr *)&dst_addr,(socklen_t *)&len2);
  66.     
  67.      if(len1 > 0)
  68.      {
  69.          
  70.          printf("------------------%d-----recv ok !!!n",info->hdr.nlmsg_pid);
  71.         printf("------------------%s-----recv ok !!!n",info->buf);

  72.         free(info);
  73.         return 0;
  74.          
  75.      }
  76.     
  77.     }
  78.     

  79. }
  80. #endif
这里我们关于头文件include/linux/netlink.h  ,可以自定义我们netlink协议.
#define   NETLINK_MYCTRL  23

点击(此处)折叠或打开

  1. #define NETLINK_ROUTE        0    /* Routing/device hook                */
  2. #define NETLINK_UNUSED        1    /* Unused number                */
  3. #define NETLINK_USERSOCK    2    /* Reserved for user mode socket protocols     */
  4. #define NETLINK_FIREWALL    3    /* Firewalling hook                */
  5. #define NETLINK_INET_DIAG    4    /* INET socket monitoring            */
  6. #define NETLINK_NFLOG        5    /* netfilter/iptables ULOG */
  7. #define NETLINK_XFRM        6    /* ipsec */
  8. #define NETLINK_SELINUX        7    /* SELinux event notifications */
  9. #define NETLINK_ISCSI        8    /* Open-iSCSI */
  10. #define NETLINK_AUDIT        9    /* auditing */
  11. #define NETLINK_FIB_LOOKUP    10    
  12. #define NETLINK_CONNECTOR    11
  13. #define NETLINK_NETFILTER    12    /* netfilter subsystem */
  14. #define NETLINK_IP6_FW        13
  15. #define NETLINK_DNRTMSG        14    /* DECnet routing messages */
  16. #define NETLINK_KOBJECT_UEVENT    15    /* Kernel messages to userspace */
  17. #define NETLINK_GENERIC        16
  18. /* leave room for NETLINK_DM (DM Events) */
  19. #define NETLINK_SCSITRANSPORT    18    /* SCSI Transports */
  20. #define NETLINK_ECRYPTFS    19

  21. #define MAX_LINKS 32        

  22. struct net;

  23. struct sockaddr_nl
  24. {
  25.     sa_family_t    nl_family;    /* AF_NETLINK    */
  26.     unsigned short    nl_pad;        /* zero        */
  27.     __u32        nl_pid;        /* port ID    */
  28.            __u32        nl_groups;    /* multicast groups mask */
  29. };

  30. struct nlmsghdr
  31. {
  32.     __u32        nlmsg_len;    /* Length of message including header */
  33.     __u16        nlmsg_type;    /* Message content */
  34.     __u16        nlmsg_flags;    /* Additional flags */
  35.     __u32        nlmsg_seq;    /* Sequence number */
  36.     __u32        nlmsg_pid;    /* Sending process port ID */
  37. };
从头文件里我们知道其实内核已经支持了一些常用的协议.
对于用户空间使用netlink我们直接调用socket API即可.  
 fd = socket(AF_NETLINK,SOCK_RAW,NETLINK_MYCTRL);  
关于socket的几个参数这里不过多解释. 上面例子我们是为了向内核发送一个消息,内核处理后,发送回来,我们来接收. 下面就看看内核代码: 

点击(此处)折叠或打开

  1. #include linux/kernel.h>
  2. #include linux/module.h>
  3. #include linux/types.h>
  4. #include linux/sched.h>
  5. #include net/sock.h>
  6. #include linux/netlink.h>

  7. int my_pid;
  8. struct sock * myctrlnl;


  9. static void netlink_kernel_rcv(struct sk_buff *skb)
  10. {
  11.     struct nlmsghdr *nlh = NULL;
  12.   
  13.     
  14.     nlh = nlmsg_hdr(skb);
  15.      
  16.             if(nlh->nlmsg_type == NETLINK_MYCTRL){
  17.                
  18.                 my_pid = nlh->nlmsg_pid; //record pid
  19.                 printk("NETLINK_TEST_U_PID: user_proc.pid = %dn",my_pid);
  20.           
  21.                 printk("%s: received netlink message payload:%sn", __FUNCTION__, (char*)NLMSG_DATA(nlh));
  22.             
  23.         skb = skb_clone(skb, GFP_KERNEL);
  24.         if (skb == NULL)
  25.                 return;

  26.              nlh = nlmsg_hdr(skb);
  27.             nlh->nlmsg_pid =5;
  28.             memcpy((char *)NLMSG_DATA(nlh),"yes,we do!",20);
  29.             netlink_unicast(myctrlnl, skb, my_pid, MSG_DONTWAIT);
  30.      }
  31.  }




  32. void __init mynetlink_init(void)
  33. {
  34.     
  35.     /*test my netlink */
  36.     myctrlnl = netlink_kernel_create(&init_net, NETLINK_MYCTRL, MYCTRLNLGRP_MAX, netlink_kernel_rcv,
  37.      NULL, THIS_MODULE);
  38.     if (myctrlnl == NULL)
  39.         panic("ctrlnetlink_init: cannot initialize myctrlnetlinkn");

  40. }
这里是接收到用户空间消息后,打印pid ,和传递的数据负载.  然后修改后,在传递回用户空间. 这里有个小插曲就是关于要用skb_clone.
这里参考的是内核代码: 

点击(此处)折叠或打开

  1. static void nl_fib_input(struct sk_buff *skb)
  2. {
  3.     struct net *net;
  4.     struct fib_result_nl *frn;
  5.     struct nlmsghdr *nlh;
  6.     struct fib_table *tb;
  7.     u32 pid;

  8.     net = sock_net(skb->sk);
  9.     nlh = nlmsg_hdr(skb);
  10.     if (skb->len NLMSG_SPACE(0) || skb->len nlh->nlmsg_len ||
  11.      nlh->nlmsg_len NLMSG_LENGTH(sizeof(*frn)))
  12.         return;

  13.     skb = skb_clone(skb, GFP_KERNEL);
  14.     if (skb == NULL)
  15.         return;
  16.     nlh = nlmsg_hdr(skb);

  17.     frn = (struct fib_result_nl *) NLMSG_DATA(nlh);
  18.     tb = fib_get_table(net, frn->tb_id_in);

  19.     nl_fib_lookup(frn, tb);

  20.     pid = NETLINK_CB(skb).pid; /* pid of sending process */
  21.     NETLINK_CB(skb).pid = 0; /* from kernel */
  22.     NETLINK_CB(skb).dst_group = 0; /* unicast */
  23.     netlink_unicast(net->ipv4.fibnl, skb, pid, MSG_DONTWAIT);
  24. }

有时候我们不仅仅要自己修改传递过来的skb,或许我们想自己新创建一个:

点击(此处)折叠或打开

  1. static int send_to_kernel(void)
  2. {
  3.     struct sk_buff *skb;
  4.     struct nlmsghdr* nlh;    
  5.     char msg[6] ="hello";
  6.     char *msg1;
  7.     int size,pid;
  8.     unsigned char *b;
  9.        printk("----here send from kernel :%dn",my_pid);
  10.        size_t payload = sizeof(*msg);
  11.     
  12.     //计算skb分配长度
  13.         size = NLMSG_SPACE(20);

  14.     //分配skb
  15.     skb = alloc_skb(size, GFP_ATOMIC);
  16.     if (NULL == skb )
  17.     {     
  18.         printk(" skb malloc error.\n");
  19.         return -1;
  20.     }
  21.     
  22.     nlh = NLMSG_PUT (skb, 0, 0, 0, 20);
  23.     memcpy((char *)NLMSG_DATA(nlh),"nihao",20);
  24.     nlh->nlmsg_len = NLMSG_LENGTH(20);
  25.        
  26.     NETLINK_CB(skb).pid = 0; /* from kernel */
  27.     NETLINK_CB(skb).dst_group = 0; /* unicast */    
  28.     
  29.     netlink_unicast(myctrlnl, skb, my_pid, MSG_DONTWAIT);
  30.     return 0;    
  31. nlmsg_failure:
  32.     kfree_skb (skb);
  33.     return -1;
  34. }
内核里使用netlink需要调用 netlink_kernel_create函数,不同内核版本参数有变动,这里是用的2.6.32.60 
很多时候我们不想这么麻烦的传递一个东西,先是从用户空间传递一个消息(主要是为了pid ,相对于单播) ,然后内核才能传递给用户空间特定的进程. 我们有时候会需要不理会用户空间,直接从内核传递到用户空间,然后在做处理,那么这里就需要到netlink的广播功能.  
那么相对单播广播其实需要改动的地方也不大 :
对于内核部分我们只需要修改:

点击(此处)折叠或打开

  1.         NETLINK_CB(skb).pid =0;
  2.         NETLINK_CB(skb).dst_group = MYCTRLNLGRP_TEST;
  3.         netlink_broadcast(myctrlnl,skb,0,MYCTRLNLGRP_TEST,GFP_ATOMIC);
我们同样需要在netlink头文件里定义我们的广播协议:

点击(此处)折叠或打开

  1. enum myrlnetlink_groups {
  2.     MYCTRLNLGRP_NONE,
  3. #define MYCTRLNLGRP_NONE        MYCTRLNLGRP_NONE
  4.         MYCTRLNLGRP_TEST,
  5. #define MYCTRLNLGRP_TEST MYCTRLNLGRP_TEST
  6.         __MYRLNLGRP_MAX
  7. };
  8. #define MYRLNLGRP_MAX    (__MYRLNLGRP_MAX - 1)
那么我们用户空间的程序需要修改些什么呢?  

src_addr.nl_groups = MYCTRLNLGRP_TEST; 

这里我们并没有关注太多的细节,而是直接拿来个例子.当然更关注的是如何应用,至于其他的深入分析待以后更加了解后在说吧.只是为了学习netlink一个小小的开始.



上一篇:SharePoint 读取选项字段所有Choise


下一篇:超30省市曝管理漏洞:数千万社保用户信息或泄露