Rust 切片(Slice)类型详解 - 通过实践掌握核心概念-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_01146/article/details/148392431

Rust 切片(Slice)类型详解 - 通过实践掌握核心概念

rust-by-practice Learning Rust By Practice, narrowing the gap between beginner and skilled-dev through challenging examples, exercises and projects. 项目地址: https://gitcode.com/gh_mirrors/ru/rust-by-practice

什么是切片(Slice)

切片是 Rust 中一种非常重要的数据类型，它允许你引用集合中一段连续的元素序列，而不需要获取整个集合的所有权。切片本质上是一个"视图"，它提供了对底层数据的访问，但不拥有这些数据。

与数组不同，切片的长度在编译时是未知的，这使得切片更加灵活。切片类型通常以引用的形式出现，如 &[i32] 或 &str。

切片的基本特性

切片引用是一个双字对象：

第一个字是指向数据的指针
第二个字是切片的长度

这两个字的大小与 usize 相同，由处理器架构决定。例如，在 x86-64 架构上是 64 位。

let arr = [1, 2, 3];
let s1: &[i32] = &arr[0..2]; // 正确写法，使用切片引用

切片的内存布局

让我们通过一个例子来理解切片的内存布局：

fn main() {
    let arr: [char; 3] = ['中', '国', '人'];
    let slice = &arr[..2];
    
    // 切片引用的大小是16字节(64位系统)
    assert!(std::mem::size_of_val(&slice) == 16);
}

注意：在64位系统上，切片引用本身的大小是16字节(8字节指针+8字节长度)，而不是切片内容的大小。

创建和使用切片

切片可以通过范围语法从数组中创建：

fn main() {
    let arr: [i32; 5] = [1, 2, 3, 4, 5];
    let slice: &[i32] = &arr[1..4]; // 包含索引1，不包含索引4
    assert_eq!(slice, &[2, 3, 4]);
}

字符串切片

字符串切片 &str 是一种特殊类型的切片，用于处理 UTF-8 编码的文本：

fn main() {
    let s = String::from("hello");
    let slice1 = &s[0..2];
    let slice2 = &s[..2]; // 可以省略起始索引
    assert_eq!(slice1, slice2);
}

处理中文字符时需要特别注意，因为中文字符在 UTF-8 中通常占用3个字节：

fn main() {
    let s = "你好，世界";
    let slice = &s[0..3]; // "你"占用3个字节
    assert!(slice == "你");
}

隐式转换：&String 到 &str

Rust 提供了从 &String 到 &str 的隐式转换，这称为 Deref 强制转换：

fn main() {
    let mut s = String::from("hello world");
    let letter = first_letter(&s); // &String 自动转换为 &str
    
    // s.clear(); // 这里会导致编译错误，因为letter还持有不可变引用
    println!("the first letter is: {}", letter);
}

fn first_letter(s: &str) -> &str {
    &s[..1]
}