Skip to content

Latest commit

 

History

History
194 lines (156 loc) · 11.1 KB

File metadata and controls

194 lines (156 loc) · 11.1 KB

参考信息

typedef struct {
    Elf64_Word      st_name;
    unsigned char   st_info;
    unsigned char   st_other;
    Elf64_Half      st_shndx;
    Elf64_Addr      st_value;
    Elf64_Xword     st_size;
} Elf64_Sym;
  • st_name - 符号名称在字符串表中的偏移
  • st_info - 符号类型和绑定信息
    • bind(高4位):决定链接时的处理方式
      • 0 - STB_LOCAL:局部符号,仅在定义它的文件中可见
      • 1 - STB_GLOBAL:全局符号,在所有文件中可见
      • 2 - STB_WEAK:弱符号,类似于全局符号,但可以被其他符号覆盖
    • type(低4位):符号类型
      • STT_NOTYPE 未分类
      • STT_OBJECT 数据对象(变量)
      • STT_FUNC 函数
      • STT_SECTION 段符号
      • STT_FILE 文件符号
  • st_other - 符号的其他信息(通常为0)
    • 低 2 位表示可见性
      • STV_DEFAULT:默认可见性
      • STV_HIDDEN:隐藏符号
      • STV_PROTECTED:受保护符号
    • 内核不会加载 STV_HIDDEN 的符号(它们不导出)
  • st_shndx - 符号所在的节区索引
    • 特殊值:
      • SHN_UNDEF (0):未定义符号
      • SHN_ABS (0xfff1):绝对符号
      • SHN_COMMON (0xfff2):公共符号,common 块(全局变量未初始化)
  • st_value - 符号的值(地址)
    • 如果符号在某 section 中(定义符号),则为该符号在 section 中的偏移
    • 如果符号未定义,则为0
    • 如果是绝对符号(SHN_ABS),则为绝对地址
  • st_size - 符号的大小(以字节为单位)用于调试、统计等目的

内核模块参数

内核模块参数允许在加载模块时传递参数,以配置模块的行为。参数可以通过module_param宏定义,并指定类型和权限。例如:

#include <linux/module.h>
static int my_param = 0;
module_param(my_param, int, 0644);

这段代码定义了一个名为my_param的整数参数,默认值为0,并且权限设置为0644(允许读写)。加载模块时,可以通过命令行参数传递参数值,例如:

insmod my_module.ko my_param=42

在内核中,模块参数通过struct kernel_param结构体进行管理,该结构体包含参数的名称、类型、权限以及指向参数值的指针。内核模块加载器会解析传递的参数,并将其值设置到相应的变量中。

#[repr(C)]
#[derive(Copy, Clone)]
pub struct kernel_param {
    pub name: *const core::ffi::c_char,
    pub mod_: *mut module,
    pub ops: *const kernel_param_ops,
    pub perm: u16_,
    pub level: s8,
    pub flags: u8_,
    pub __bindgen_anon_1: kernel_param__bindgen_ty_1,
}

我们需要关注ops字段,它指向一个kernel_param_ops结构体,该结构体定义了操作函数,用于处理参数的设置和获取。内核为不同类型的参数提供了不同的操作函数,例如整数、字符串等。通过这些操作函数,内核模块可以正确地解析和处理传递的参数值。然而,这些ops并不是直接可见的,在kernel/params.c中,这些ops通过宏进行定义和注册,例如:

#define STANDARD_PARAM_DEF(name, type, format, strtolfn)      		\
	int param_set_##name(const char *val, const struct kernel_param *kp) \
	{								\
		return strtolfn(val, 0, (type *)kp->arg);		\
	}								\
	int param_get_##name(char *buffer, const struct kernel_param *kp) \
	{								\
		return scnprintf(buffer, PAGE_SIZE, format "\n",	\
				*((type *)kp->arg));			\
	}								\
	const struct kernel_param_ops param_ops_##name = {			\
		.set = param_set_##name,				\
		.get = param_get_##name,				\
	};								\
	EXPORT_SYMBOL(param_set_##name);				\
	EXPORT_SYMBOL(param_get_##name);				\
	EXPORT_SYMBOL(param_ops_##name)


STANDARD_PARAM_DEF(byte,	unsigned char,		"%hhu",		kstrtou8);
STANDARD_PARAM_DEF(short,	short,			"%hi",		kstrtos16);
STANDARD_PARAM_DEF(ushort,	unsigned short,		"%hu",		kstrtou16);
STANDARD_PARAM_DEF(int,		int,			"%i",		kstrtoint);
STANDARD_PARAM_DEF(uint,	unsigned int,		"%u",		kstrtouint);
STANDARD_PARAM_DEF(long,	long,			"%li",		kstrtol);
STANDARD_PARAM_DEF(ulong,	unsigned long,		"%lu",		kstrtoul);
STANDARD_PARAM_DEF(ullong,	unsigned long long,	"%llu",		kstrtoull);
STANDARD_PARAM_DEF(hexint,	unsigned int,		"%#08x", 	kstrtouint);

在Rust实现中,如果要支持内核模块参数的功能,需要在kmod库中添加对这些ops的支持,以便正确处理不同类型的参数。

LKM 兼容性

尽管LKM(Loadable Kernel Module)使得内核功能变得灵活和可扩展,但是LKM并不是二进制兼容的,甚至在API上也不保证兼容性,这导致不同内核版本之间LKM需要重新编译。为了实现加载LKM的目标,需要确定以下几点:

  • 内核版本:不同的内核版本可能有不同的内核API和数据结构定义
  • 架构:不同的CPU架构(如x86_64, arm64, riscv64等)可能具有架构相关的定义
  • 内核配置选择:内核配置选项(如启用或禁用某些功能)可能影响内核数据结构和API

在确定了这三点后,就可以明确LKM的编译环境,进而在kmod库中添加相关的数据结构定义,从而实现LKM的正确加载和运行。

特殊问题

  • 在la64架构上,如果没有设置code-model,可能会产生特殊的重定位项。比如其默认使用的medium code-model,会导致生成R_LARCH_CALL36重定位类型,这在内核模块加载时是不被支持的。因此,需要在编译时指定-C code-model=small来避免这种情况的发生。
  • --gc-sections 链接选项可以移除未使用的节,从而减少模块大小与重定位数量
  • linux的lkm 会产生.__mcount_locs节, 该节用于支持内核的函数调用跟踪功能。如果模块不使用该功能, 可以通过ccflags-remove-y := -pg来避免生成该节。
  • linux的lkm 会产生.__patchable_function_entries节, 这个功能与.__mcount_locs类似, 可以通过ccflags-remove-y := -fpatchable-function-entry=%来避免生成该节。
  • linux的lkm 会产生.return_sites节, 记录了“每个函数里 return 指令的位置”,用于运行时动态打补丁,实现函数返回路径的跟踪与修改。

x86_64架构下的内核模块重定位问题:

根据 内核文档 中的描述:x86_64 架构下,内核模块所在的虚拟地址空间范围是 0xffffffffa0000000ffffffffff000000。 这个地址区间的设置是与其重定位项相关的,对于R_X86_64_32S类型的重定位项,内核需要对计算出来的地址进行截断并进行符号扩展,以确保地址的正确性。如果高位不为1,加载器会返回错误。What do R_X86_64_32S and R_X86_64_64 relocation mean? 该文档有一些示例说明。

目前,Starry的基座Arceos的内核地址空间起始地址位于0xffff_8000_0020_0000,其布局与Linux具有较大的差别。Linux内核在编译内核模块时会选用code-model=kernel,这与其地址空间布局密切相关。因此无法当前无法直接使用该code-model来编译内核模块。为了解决这个问题,目前的做法是使用code-model=large来编译内核模块,这样可以避免生成一些跟地址空间布局相关的重定位项,从而避免上述问题的发生。但是使用该code-model会导致kernel 部分编译的结果无法运行。在默认的的情况下,kernel部分会使用code-model=small进行编译。

  • 未来可以考虑通过修改内核地址空间布局来解决这个问题,从而使得内核模块可以使用code-model=kernel进行编译。

Linux数据结构

可以通过以下命令确定内核某些头文件中的数据结构定义(源码目录下):

gcc -E \
  -Iinclude \
  -Iinclude/generated \
  -Iarch/$(ARCH)/include \
  -Iarch/$(ARCH)/include/generated \
  -include include/linux/kconfig.h \
  -include include/generated/autoconf.h \
  target.h > target.i

在发行版的内核头文件中,可以使用类似如下的命令来预处理内核模块相关的数据结构定义,例如module.h:

COMMON=/usr/src/linux-headers-6.17.13+deb14-common
ARCH=/usr/src/linux-headers-6.17.13+deb14-riscv64
KDIR=/lib/modules/6.17.13+deb14-riscv64/build

gcc -E \
    -I$COMMON/include \
    -I$COMMON/include/generated \
    -I$COMMON/arch/riscv/include \
    -I$ARCH/arch/riscv/include \
    -I$ARCH/arch/riscv/include/generated \
    -I$ARCH/include \
    -include $COMMON/include/linux/kconfig.h \
    -include $KDIR/include/generated/autoconf.h \
    $COMMON/include/linux/module.h > module.i

Rusty kernel module的编译过程

在编译Rusty kernel module时,通常会经历以下几个步骤:

  1. 编写模块代码:使用Rust编写内核模块代码,定义模块的初始化和清理函数,以及所需的功能。
  2. 编译模块:使用Cargo进行编译,生成静态库文件(.rlib)。在编译过程中,可能需要 指定适当的编译选项和目标,以确保生成的代码与内核环境兼容。
  3. 链接模块:使用链接器(如ld)将生成的静态库文件直接进行单独链接,生成内核模块文件(.ko)。

对于rust编译器来说,生成的.rlib文件实际上是一个归档文件(类似于.a文件),其中包含了编译后的目标文件和元数据。但是,.rlib文件与传统的静态库文件在格式上有所不同,它只包含当前crate的代码和数据,而不包含依赖项,这正是我们所需要的。

需要注意的是,不能在编译时开启LTO, LTO会生成链接器无法识别的内容

和C语言不一样,Rust的编译器会尽可能对代码进行优化和内联,这可能会导致一些函数和数据没有被正确地导出到最终的模块文件中。这对kernel的编译很重要,因为可能一些函数在kernel部分没有被使用,但是在module部分被使用了。如果没有正确导出,这些module无法被正确加载和运行。

RUSTFLAGS可以用来传递给rustc编译器的选项。解决上述问题的方法是使用-C link-dead-code选项,这个选项会告诉编译器保留所有的代码和数据,即使它们没有被使用。这样可以确保所有需要的符号都被正确地导出到最终的模块文件中,从而避免加载时出现未定义符号的错误。Rust Reference: Link Dead Code

-C link-dead-code选项与-Zbuild-std=core,alloc,compiler_builtins选项冲突,因此需要在使用-C link-dead-code时,移除-Zbuild-std选项。 Rust Reference: Build Standard Library

在loongarch64架构下,-C link-dead-code选项必须对kernel的编译和module的编译都生效,否则会导致它们无法共享相同的编译产物。但是其它架构下,-C link-dead-code可以只针对kernel的编译生效。

参考链接