合并有序数据块

第一次使用 Rust 写相对完整的程序，可能还有很多可改进的地方（求建议qwq）~

题目

为了方便，本次实现处理 unsigned int64 而非 int64。

给定 k 个满足下述条件的有序 unsigned int64 数据块（可看作数组）：

需要设计并实现一个将所有有序数据块合并的算法，同时应当尽可能利用多核处理器这一特性，并使用不超过 16GiB 内存。

在当前实现里，k 个数据块被分别存放在文件 0.in, 1.in, ... (k - 1).in 中。为了使观察更加容易，每一个数都以字符串的形式被存储并且以空格隔开。程序会产生结果文件 result.txt。

内存大小有限导致无法将所有数据放入内存处理，此时硬盘 I/O 性能可能成为瓶颈，故需要在理论复杂度与 I/O 次数间做妥协。注意到数据值域相对较小 (0 ~ 2^64 - 1)，因此考虑依据值域进行分段处理。

将值域 [0 .. 2^64 - 1] 切分成 512 (2^9) 长度相等的段。第 i 段记作 p[i]，且 p[i] = [i * 2^55 .. i * 2^56 - 1]；
对于每一段 p[i]：
- 遍历每一个数据块，筛选出所有大小坐落于 p[i] 中的数值，将它们存放于数组 a[i] 中；
- 数据服从均匀分布，因此数组 a[i] 之间大小相对接近，不太可能超出内存限制；
- 采用多线程排序算法对 a[i] 进行排序，并插入结果文件末尾；

对于较早的 commit 采用 perf 进行性能分析后，发现瓶颈在于筛选时大量的文件 I/O:
- 采用 BufReader 以带缓冲区的方式读取数据块，以减少所需系统调用次数从而提升读取性能；
- 对于每个数据块，读取到大小超出当前段的值时即停止读取（因此会将第一个大于当前段的值缓存在内存里），下一次读取该数据段时会从该位置继续读取，从而保证在筛选这一步每个值只会被读 O(1) 次。
对于筛选步骤，另一个等价的做法是首先为每一个段在硬盘上创建一个文件。接下来遍历每一个数据块，对于每一个数据计算其应当位于那一段，并将其写入对应的文件。
- 优点：相比当前做法，不需要将每一数据段的候选值缓存于内存里。因此能更好应对数据段数量极大（甚至以至于候选值无法被放入内存），而每一个数据段大小极小的情况；
- 缺点：当数据量较小时可能引入大量随机写（相比随机读可能带来更大开销），但是数据量较大时由于均匀分布，可能多个连续的值都会属于同一段，如果再辅以 BufWriter 以带缓冲区的方式进行文件写入可能不会带来太大影响。
- 实现：若数据段数量较小则采用前文所述方案，若数据段数量较大则采用本节所述方案。

采用如下指令进行编译：

cargo build --release

接下来在项目根目录下创建数据块。将他们命名为 0.in, 1.in, ..., (k - 1).in。每一个文件包含以空格隔开的若干 unsigned int64 数字。采用如下指令运行程序：

cargo run <数据块数量>

结果将会被存放在位于项目根目录的 result.txt 文件里。