在 Linux 下用户空间和内核空间数据交换的方式.docx
- 文档编号:100262
- 上传时间:2023-04-28
- 格式:DOCX
- 页数:35
- 大小:42.16KB
在 Linux 下用户空间和内核空间数据交换的方式.docx
《在 Linux 下用户空间和内核空间数据交换的方式.docx》由会员分享,可在线阅读,更多相关《在 Linux 下用户空间和内核空间数据交换的方式.docx(35页珍藏版)》请在冰点文库上搜索。
在Linux下用户空间和内核空间数据交换的方式
本系列文章包括两篇,他们文周详地地介绍了Linux系统下用户空间和内核空间数据交换的九种方式,包括内核启动参数、模块参数和sysfs、
sysctl、系统调用、netlink、procfs、seq_file、debugfs和relayfs,并给出具体的例子帮助读者掌控这些技术的使
用。
本文是该系列文章的第二篇,他介绍了procfs、seq_file、debugfs和relayfs,并结合给出的例子程式周详地说明了他们怎么使用。
1、内核启动参数
Linux提供了一种通过bootloader向其传输启动参数的功能,内核研发者能通过这种方式来向内核传输数据,从而控制内核启动行为。
通常的使用方式是,定义一个分析参数的函数,而后使用内核提供的宏__setup把他注册到内核中,该宏定义在linux/init.h中,因此要使用他必须包含该头文件:
__setup("para_name=",parse_func)
para_name为参数名,parse_func
为分析参数值的函数,他负责把该参数的值转换成相应的内核变量的值并设置那个内核变量。
内核为整数参数值的分析提供了函数get_option和
get_options,前者用于分析参数值为一个整数的情况,而后者用于分析参数值为逗号分割的一系列整数的情况,对于参数值为字符串的情况,需要研发
者自定义相应的分析函数。
在原始码包中的内核程式kern-boot-params.c
说明了三种情况的使用。
该程式列举了参数为一个整数、逗号分割的整数串及字符串三种情况,读者要想测试该程式,需要把该程式拷贝到要使用的内核的源码目
录树的一个目录下,为了避免和内核其他部分混淆,作者建议在内核源码树的根目录下创建一个新目录,如examples,然后把该程式拷贝到
examples目录下并重新命名为setup_example.c,并且为该目录创建一个Makefile文件:
obj-y=setup_example.o
Makefile仅许这一行就足够了,然后需要修改源码树的根目录下的Makefile文件的一行,把下面行
core-y :
=usr/
修改为
core-y :
=usr/examples/
注意:
如果读者创建的新目录和重新命名的文件名和上面不同,需要修改上面所说Makefile文件相应的位置。
做完以上工作就能按照内核构建步骤去构建新的内核,在构建好内核并设置好lilo或grub为该内核的启动条目后,就能启动该内核,然后使用lilo或grub的编辑功能为该内核的启动参数行增加如下参数串:
setup_example_int=1234setup_example_int_array=100,200,300,400setup_example_string=Thisisatest
当然,该参数串也能直接写入到lilo或grub的设置文件中对应于该新内核的内核命令行参数串中。
读者能使用其他参数值来测试该功能。
下面是作者系统上使用上面参数行的输出:
setup_example_int=1234
setup_example_int_array=100,200,300,400
setup_example_int_arrayincludes4intergers
setup_example_string=Thisisatest
读者能使用
dmesg|grepsetup
来查看该程式的输出。
2、模块参数和sysfs
内核子系统或设备驱动能直接编译到内核,也能编译成模块,如果编译到内核,能使用前一节介绍的方法通过内核启动参数来向他们传递参数,如果编译成模块,则能通过命令行在插入模块时传递参数,或在运行时,通过sysfs来设置或读取模块数据。
Sysfs是个基于内存的文件系统,实际上他基于ramfs,sysfs提供了一种把内核数据结构,他们的属性及属性和数据结构的联系开放给用
户态的方式,他和kobject子系统紧密地结合在一起,因此内核研发者不必直接使用他,而是内核的各个子系统使用他。
用户要想使用sysfs
读取和设置内核参数,仅需装载sysfs就能通过文件操作应用来读取和设置内核通过sysfs开放给用户的各个参数:
$mkdir-p/sysfs
$mount-tsysfssysfs/sysfs
注意,不要把sysfs和sysctl混淆,sysctl是内核的一些控制参数,其目的是方便用户对内核的行为进行控制,而
sysfs仅仅是把内核的kobject对象的层次关系和属性开放给用户查看,因此sysfs的绝大部分是只读的,模块作为一个
kobject也被出口到sysfs,模块参数则是作为模块属性出口的,内核实现者为模块的使用提供了更灵活的方式,允许用户设置模块参数在
sysfs的可见性并允许用户在编写模块时设置这些参数在sysfs下的访问权限,然后用户就能通过sysfs
来查看和设置模块参数,从而使得用户能在模块运行时控制模块行为。
对于模块而言,声明为static的变量都能通过命令行来设置,但要想在sysfs下可见,必须通过宏module_param
来显式声明,该宏有三个参数,第一个为参数名,即已定义的变量名,第二个参数则为变量类型,可用的类型有byte,short,ushort,
int,uint,long,ulong,charp和bool或invbool,分别对应于c类型char,short,
unsignedshort,int,unsignedint,long,unsignedlong,char*和
int,用户也能自定义类型XXX(如果用户自己定义了param_get_XXX,param_set_XXX和
param_check_XXX)。
该宏的第三个参数用于指定访问权限,如果为0,该参数将不出目前sysfs文件系统中,允许的访问权限为
S_IRUSR,S_IWUSR,S_IRGRP,S_IWGRP,S_IROTH和S_IWOTH
的组合,他们分别对应于用户读,用户写,用户组读,用户组写,其他用户读和其他用户写,因此用文件的访问权限设置是一致的。
在
原始码包
中的内核模块module-param-exam.c是个利用模块参数和sysfs来进行用户态和内核态数据交互的例子。
该模块有三个参数能通过命令行设置,下面是作者系统上的运行结果示例:
$insmod./module-param-exam.komy_invisible_int=10my_visible_int=20mystring="Hello,World"
my_invisible_int=10
my_visible_int=20
mystring=’Hello,World’
$ls/sys/module/module_param_exam/parameters/
mystring my_visible_int
$cat/sys/module/module_param_exam/parameters/mystring
Hello,World
$cat/sys/module/module_param_exam/parameters/my_visible_int
20
$echo2000>/sys/module/module_param_exam/parameters/my_visible_int
$cat/sys/module/module_param_exam/parameters/my_visible_int
2000
$echo"abc">/sys/module/module_param_exam/parameters/mystring
$cat/sys/module/module_param_exam/parameters/mystring
abc
$rmmodmodule_param_exam
my_invisible_int=10
my_visible_int=2000
mystring=’abc’
3、sysctl
Sysctl是一种用户应用来设置和获得运行时内核的设置参数的一种有效方式,通过这种方式,用户应用能在内核运行的所有时刻来改动内核的设置参
数,也能在所有时候获得内核的设置参数,通常,内核的这些设置参数也出目前proc文件系统的/proc/sys目录下,用户应用能直接通过这个目录
下的文件来实现内核设置的读写操作,例如,用户能通过
Cat/proc/sys/net/ipv4/ip_forward
来得知内核IP层是否允许转发IP包,用户能通过
echo1>/proc/sys/net/ipv4/ip_forward
把内核IP层设置为允许转发IP包,即把该机器设置成一个路由器或网关。
一般地,所有的Linux发布也提供了一个系统工具sysctl,他能设置和读取内核的设置参数,不过该工具依赖于proc文件系统,为了使用该工具,内核必须支持proc文件系统。
下面是使用sysctl工具来获取和设置内核设置参数的例子:
$sysctlnet.ipv4.ip_forward
net.ipv4.ip_forward=0
$sysctl-wnet.ipv4.ip_forward=1
net.ipv4.ip_forward=1
$sysctlnet.ipv4.ip_forward
net.ipv4.ip_forward=1
注意,参数net.ipv4.ip_forward实际被转换到对应的proc
文件/proc/sys/net/ipv4/ip_forward,选项-w表示设置该内核设置参数,没有选项表示读内核设置参数,用户能使用
sysctl-a来读取所有的内核设置参数,对应更多的sysctl工具的信息,请参考手册页sysctl(8)。
不过proc文件系统对sysctl不是必须的,在没有proc文件系统的情况下,仍然能,这时需要使用内核提供的系统调用sysctl来实现对内核设置参数的设置和读取。
在
原始码包
中
给出了一个实际例子程式,他说明了怎么在内核和用户态使用sysctl。
头文件sysctl-exam.h定义了sysctl条目
ID,用户态应用和内核模块需要这些ID来操作和注册sysctl条目。
内核模块在文件sysctl-exam-kern.c
中实现,在该内核模块中,每一个sysctl条目对应一个structctl_table结构,该结构定义了要注册的sysctl条目的
ID(字段ctl_name),在proc
下的名称(字段procname),对应的内核变量(字段data,注意该该字段的赋值必须是指针),条目允许的最大长度(字段maxlen,他主要用于
字符串内核变量,以便在对该条目设置时,对超过该最大长度的字符串截掉后面超长的部分),条目在proc文件系统下的访问权限(字段mode),在通过
proc设置时的处理函数(字段proc_handler,对于整型内核变量,应当设置为&proc_dointvec,而对于字符串内核变量,
则设置为&proc_dostring),字符串处理策略(字段strategy,一般这是为&sysctl_string)。
Sysctl条目能是目录,此时mode字段应当设置为0555,否则通过sysctl系统调用将无法访问他下面的sysctl
条目,child则指向该目录条目下面的所有条目,对于在同一目录下的多个条目,不必一一注册,用户能把他们组织成一个struct
ctl_table类型的数组,然后一次注册就能,但此时必须把数组的最后一个结构设置为NULL,即
{
.ctl_name=0
}
注册sysctl条目使用函数register_sysctl_table(structctl_table*,
int),第一个参数为定义的struct
ctl_table结构的sysctl条目或条目数组指针,第二个参数为插入到sysctl条目表中的位置,如果插入到末尾,应当为0,如果插入到开头,
则为非0。
内核把所有的sysctl条目都组织成sysctl表。
当模块卸载时,需要使用函数unregister_sysctl_table(structctl_table_header
*)解注册通过函数register_sysctl_table注册的sysctl条目,函数register_sysctl_table在调用成功时返
回结构structctl_table_header,他就是sysctl表的表头,解注册函数使用他来卸载相应的sysctl条目。
用户态应用sysctl-exam-user.c通过sysctl系统调用来查看和设置前面内核模块注册的sysctl条目(当然如果用户的系统内核已
支持proc文件系统,能直接使用文件操作应用如cat,echo等直接查看和设置这些sysctl条目)。
下面是作者运行该模块和应用的输出结果示例:
$insmod./sysctl-exam-kern.ko
$cat/proc/sys/mysysctl/myint
0
$cat/proc/sys/mysysctl/mystring
$./sysctl-exam-user
mysysctl.myint=0
mysysctl.mystring=""
$./sysctl-exam-user100"Hello,World"
oldvalue:
mysysctl.myint=0
newvalue:
mysysctl.myint=100
oldvale:
mysysctl.mystring=""
newvalue:
mysysctl.mystring="Hello,World"
$cat/proc/sys/mysysctl/myint
100
$cat/proc/sys/mysysctl/mystring
Hello,World
$
4、系统调用
系统调用是内核提供给应用程式的接口,应用对底层硬件的操作大部分都是通过调用系统调用来完成的,例如得到和设置系统时间,就需要分别调用
gettimeofday和settimeofday来实现。
事实上,所有的系统调用都涉及到内核和应用之间的数据交换,如文件系统操作函数
read和write,设置和读取网络协议栈的setsockopt和
getsockopt。
本节并不是讲解怎么增加新的系统调用,而是讲解怎么利用现有系统调用来实现用户的数据传输需求。
一般地,用户能建立一个伪设备来作为应用和内核之间进行数据交换的渠道,最通常的做法是使用伪字符设备,具体实现方法是:
1.定义对字符设备进行操作的必要函数并设置结构structfile_operations
结构structfile_operations非常大,对于一般的数据交换需求,只定义open,read,write,
ioctl,mmap和release函数就足够了,他们实际上对应于用户态的文件系统操作函数open,read,write,
ioctl,mmap和close。
这些函数的原型示例如下:
ssize_texam_read(structfile*file,char__user*buf,size_tcount,loff_t*ppos)
{
…
}
ssize_texam_write(structfile*file,constchar__user*buf,size_tcount,loff_t*ppos)
{
…
}
intexam_ioctl(structinode*inode,structfile*file,unsignedintcmd,unsignedlongargv)
{
…
}
intexam_mmap(structfile*,structvm_area_struct*)
{
…
}
intexam_open(structinode*inode,structfile*file)
{
…
}
intexam_release(structinode*inode,structfile*file)
{
…
}
在定义了这些操作函数后需要定义并设置结构structfile_operations
structfile_operationsexam_file_ops={
.owner=THIS_MODULE,
.read=exam_read,
.write=exam_write,
.ioctl=exam_ioctl,
.mmap=exam_mmap,
.open=exam_open,
.release=exam_release,
};
2.注册定义的伪字符设备并把他和上面的structfile_operations关联起来:
intexam_char_dev_major;
exam_char_dev_major=register_chrdev(0,"exam_char_dev",&exam_file_ops);
注意,函数register_chrdev的第一个参数如果为
0,表示由内核来确定该注册伪字符设备的主设备号,这是该函数的返回为实际分配的主设备号,如果返回小于
0,表示注册失败。
因此,用户在使用该函数时必须判断返回值以便处理失败情况。
为了使用该函数必须包含头文件linux/fs.h。
在原始码包中给出了一个使用这种方式实现用户态和内核态数据交换的典型例子,他包含了三个文件:
头文件syscall-exam.h定义了ioctl命令,.c文件
syscall-exam-user.c为用户态应用,他通过文件系统操作函数mmap和ioctl来和内核态模块交换数据,.c文件
syscall-exam-kern.c为内核模块,他实现了一个伪字符设备,以便和用户态应用进行数据交换。
为了正确运行应用程式
syscall-exam-user,需要在插入模块syscall-exam-kern
后创建该实现的伪字符设备,用户能使用下面命令来正确创建设备:
$mknod/dev/mychrdevc`dmesg|grep"chardevicemychrdev"|sed’s/.*majoris//g’`0
然后用户能通过cat来读写/dev/mychrdev,应用程式syscall-exam-user则使用mmap来读数据并使用ioctl来得到该字符设备的信息及裁减数据内容,他只是示例怎么使用现有的系统调用来实现用户需要的数据交互操作。
下面是作者运行该模块的结果示例:
$insmod./syscall-exam-kern.ko
chardevicemychrdevisregistered,majoris254
$mknod/dev/mychrdevc`dmesg|grep"chardevicemychrdev"|sed’s/.*majoris//g’`0
$cat/dev/mychrdev
$echo"abcdefghijklmnopqrstuvwxyz">/dev/mychrdev
$cat/dev/mychrdev
abcdefghijklmnopqrstuvwxyz
$./syscall-exam-user
Userprocess:
syscall-exam-us(1433)
Availablespace:
65509bytes
Datalen:
27bytes
Offsetinphysical:
cc0bytes
mychrdevcontentbymmap:
abcdefghijklmnopqrstuvwxyz
$cat/dev/mychrdev
abcde
$
5、netlink
Netlink是一种特别的socket,他是Linux所特有的,类似于BSD中的AF_ROUTE
但又远比他的功能强大,目前在最新的Linux内核(2.6.14)中使用netlink进行应用和内核通信的应用非常多,包括:
路由
daemon(NETLINK_ROUTE),1-wire子系统(NETLINK_W1),用户态socket
协议(NETLINK_USERSOCK),防火墙(NETLINK_FIREWALL),socket
监视(NETLINK_INET_DIAG),netfilter日志(NETLINK_NFLOG),ipsec
安全策略(NETLINK_XFRM),SELinux事件通知(NETLINK_SELINUX),iSCSI
子系统(NETLINK_ISCSI),进程审计(NETLINK_AUDIT),转发信息表查询(NETLINK_FIB_LOOKUP),
netlinkconnector(NETLINK_CONNECTOR),netfilter
子系统(NETLINK_NETFILTER),IPv6防火墙(NETLINK_IP6_FW),DECnet
路由信息(NETLINK_DNRTMSG),内核事件向用户态通知(NETLINK_KOBJECT_UEVENT),通用
netlink(NETLINK_GENERIC)。
Netlink是一种在内核和用户应用间进行双向数据传输的非常好的方式,用户态应用使用标准的socketAPI就能使用netlink提供的强大功能,内核态需要使用专门的内核API来使用netlink。
Netlink相对于系统调用,ioctl及/proc文件系统而言具有以下好处:
1,为了使用netlink,用户仅需要在include/linux/netlink.h中增加一个新类型的netlink
协议定义即可,如
#defineNETLINK_MYTEST17
然后,内核和用户态应用就能即时通过socketAPI使用该netlink
协议类型进行数据交换。
但系统调用需要增加新的系统调用,ioctl则需要增加设备或文件,那需要不少代码,proc文件系统则需要在
/proc下添加新的文件或目录,那将使本来就混乱的/proc更加混乱。
2.
netlink是一种异步通信机制,在内核和用户态应用之间传递的消息保存在socket缓存队列中,发送消息只是把消息保存在接收者的socket的接
收队列,而不必等待接收者收到消息,但系统调用
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Linux 下用户空间和内核空间数据交换的方式 用户 空间 内核 数据 交换 方式