加载笔记内容...
加载笔记内容...
二叉堆作为优先队列的经典实现,其核心在于两个数学特性:
在工程实现中,我们利用数组的连续内存特性实现高效访问。关键索引计算公式:
parent = (idx - 1) >> 1
(位运算优化)left = (idx << 1) + 1
right = (idx << 1) + 2
1// 使用位运算优化索引计算
2fn parent_index(idx: usize) -> usize {
3 (idx.wrapping_sub(1)) >> 1 // 处理 idx=0 的边界情况
4}
这种实现方式的空间复杂度为 O(n),时间效率特性:
原始实现限定为i32
类型,实际工程中需要泛型支持:
1pub struct MinHeap<T: Ord> {
2 data: Vec<T>,
3}
4
5impl<T: Ord> MinHeap<T> {
6 fn bubble_up(&mut self, mut idx: usize) {
7 while idx > 0 {
8 let parent = (idx - 1) / 2;
9 if self.data[parent] <= self.data[idx] {
10 break;
11 }
12 self.data.swap(parent, idx);
13 idx = parent;
14 }
15 }
16}
原始代码使用递归实现 bubble_up/bubble_down,存在栈溢出风险。生产环境推荐迭代实现:
1fn bubble_down(&mut self, mut idx: usize) {
2 let len = self.data.len();
3 loop {
4 let left = 2 * idx + 1;
5 let right = 2 * idx + 2;
6 let mut min_idx = idx;
7
8 if left < len && self.data[left] < self.data[min_idx] {
9 min_idx = left;
10 }
11 if right < len && self.data[right] < self.data[min_idx] {
12 min_idx = right;
13 }
14
15 if min_idx == idx {
16 break;
17 }
18 self.data.swap(idx, min_idx);
19 idx = min_idx;
20 }
21}
Rust 的 Vec 类型在堆增长时会重新分配内存,对于高性能场景可预分配容量:
1impl<T: Ord> MinHeap<T> {
2 pub fn with_capacity(capacity: usize) -> Self {
3 MinHeap {
4 data: Vec::with_capacity(capacity),
5 }
6 }
7}
使用 Criterion.rs 进行性能分析:
1use criterion::{black_box, Criterion};
2
3fn benchmark_heap(c: &mut Criterion) {
4 let mut group = c.benchmark_group("heap-ops");
5
6 group.bench_function("push 1000 elements", |b| {
7 b.iter(|| {
8 let mut heap = MinHeap::new();
9 for i in 0..1000 {
10 heap.push(black_box(i));
11 }
12 })
13 });
14}
实现 Send + Sync 特性,配合 Arc 和 Mutex 实现并发安全堆:
1use std::sync::{Arc, Mutex};
2
3struct ConcurrentHeap<T: Ord + Send> {
4 inner: Arc<Mutex<MinHeap<T>>>,
5}
6
7impl<T: Ord + Send> ConcurrentHeap<T> {
8 pub fn push(&self, item: T) {
9 let mut guard = self.inner.lock().unwrap();
10 guard.push(item);
11 }
12}
Rust 标准库的std::collections::BinaryHeap
采用以下优化策略:
1// 标准库的 peek_mut 实现示例
2impl<T: Ord> BinaryHeap<T> {
3 pub fn peek_mut(&mut self) -> Option<PeekMut<'_, T>> {
4 if self.is_empty() {
5 None
6 } else {
7 Some(PeekMut {
8 heap: self,
9 sift: true,
10 })
11 }
12 }
13}
问题 1:堆内存分配失败
1impl<T: Ord> MinHeap<T> {
2 pub fn push_with_reserve(&mut self, item: T) -> Result<(), std::collections::TryReserveError> {
3 self.data.try_reserve(1)?;
4 self.data.push(item);
5 self.bubble_up(self.data.len() - 1);
6 Ok(())
7 }
8}
问题 2:元素比较开销大
1struct HeapItem<K: Ord, V> {
2 key: K,
3 value: V,
4}
5
6impl<K: Ord, V> Ord for HeapItem<K, V> {
7 fn cmp(&self, other: &Self) -> Ordering {
8 self.key.cmp(&other.key)
9 }
10}
问题 3:堆污染攻击
1impl<T: Ord + Validate> MinHeap<T> {
2 pub fn safe_push(&mut self, item: T) -> Result<(), ValidationError> {
3 item.validate()?;
4 self.push(item);
5 Ok(())
6 }
7}
实现生产级堆数据结构需要平衡算法理论、语言特性和硬件特性。Rust 的所有权系统在保证内存安全的同时,也带来独特的实现挑战。建议读者通过以下方式深化理解:
参考资源:
- 《算法导论》第 6 章 - 堆排序
- Rust RFC 1845 - BinaryHeap 设计文档
- 论文《The performance implications of heap allocation in modern languages》