10.4 雜湊最佳化策略¶
在演算法題中,我們常透過將線性查詢替換為雜湊查詢來降低演算法的時間複雜度。我們藉助一個演算法題來加深理解。
Question
給定一個整數陣列 nums
和一個目標元素 target
,請在陣列中搜索“和”為 target
的兩個元素,並返回它們的陣列索引。返回任意一個解即可。
10.4.1 線性查詢:以時間換空間¶
考慮直接走訪所有可能的組合。如圖 10-9 所示,我們開啟一個兩層迴圈,在每輪中判斷兩個整數的和是否為 target
,若是,則返回它們的索引。
圖 10-9 線性查詢求解兩數之和
程式碼如下所示:
two_sum.c
/* 方法一:暴力列舉 */
int *twoSumBruteForce(int *nums, int numsSize, int target, int *returnSize) {
for (int i = 0; i < numsSize; ++i) {
for (int j = i + 1; j < numsSize; ++j) {
if (nums[i] + nums[j] == target) {
int *res = malloc(sizeof(int) * 2);
res[0] = i, res[1] = j;
*returnSize = 2;
return res;
}
}
}
*returnSize = 0;
return NULL;
}
two_sum.zig
// 方法一:暴力列舉
fn twoSumBruteForce(nums: []i32, target: i32) ?[2]i32 {
var size: usize = nums.len;
var i: usize = 0;
// 兩層迴圈,時間複雜度為 O(n^2)
while (i < size - 1) : (i += 1) {
var j = i + 1;
while (j < size) : (j += 1) {
if (nums[i] + nums[j] == target) {
return [_]i32{@intCast(i), @intCast(j)};
}
}
}
return null;
}
視覺化執行
此方法的時間複雜度為 \(O(n^2)\) ,空間複雜度為 \(O(1)\) ,在大資料量下非常耗時。
10.4.2 雜湊查詢:以空間換時間¶
考慮藉助一個雜湊表,鍵值對分別為陣列元素和元素索引。迴圈走訪陣列,每輪執行圖 10-10 所示的步驟。
- 判斷數字
target - nums[i]
是否在雜湊表中,若是,則直接返回這兩個元素的索引。 - 將鍵值對
nums[i]
和索引i
新增進雜湊表。
圖 10-10 輔助雜湊表求解兩數之和
實現程式碼如下所示,僅需單層迴圈即可:
two_sum.cpp
/* 方法二:輔助雜湊表 */
vector<int> twoSumHashTable(vector<int> &nums, int target) {
int size = nums.size();
// 輔助雜湊表,空間複雜度為 O(n)
unordered_map<int, int> dic;
// 單層迴圈,時間複雜度為 O(n)
for (int i = 0; i < size; i++) {
if (dic.find(target - nums[i]) != dic.end()) {
return {dic[target - nums[i]], i};
}
dic.emplace(nums[i], i);
}
return {};
}
two_sum.java
/* 方法二:輔助雜湊表 */
int[] twoSumHashTable(int[] nums, int target) {
int size = nums.length;
// 輔助雜湊表,空間複雜度為 O(n)
Map<Integer, Integer> dic = new HashMap<>();
// 單層迴圈,時間複雜度為 O(n)
for (int i = 0; i < size; i++) {
if (dic.containsKey(target - nums[i])) {
return new int[] { dic.get(target - nums[i]), i };
}
dic.put(nums[i], i);
}
return new int[0];
}
two_sum.cs
/* 方法二:輔助雜湊表 */
int[] TwoSumHashTable(int[] nums, int target) {
int size = nums.Length;
// 輔助雜湊表,空間複雜度為 O(n)
Dictionary<int, int> dic = [];
// 單層迴圈,時間複雜度為 O(n)
for (int i = 0; i < size; i++) {
if (dic.ContainsKey(target - nums[i])) {
return [dic[target - nums[i]], i];
}
dic.Add(nums[i], i);
}
return [];
}
two_sum.ts
/* 方法二:輔助雜湊表 */
function twoSumHashTable(nums: number[], target: number): number[] {
// 輔助雜湊表,空間複雜度為 O(n)
let m: Map<number, number> = new Map();
// 單層迴圈,時間複雜度為 O(n)
for (let i = 0; i < nums.length; i++) {
let index = m.get(target - nums[i]);
if (index !== undefined) {
return [index, i];
} else {
m.set(nums[i], i);
}
}
return [];
}
two_sum.dart
/* 方法二: 輔助雜湊表 */
List<int> twoSumHashTable(List<int> nums, int target) {
int size = nums.length;
// 輔助雜湊表,空間複雜度為 O(n)
Map<int, int> dic = HashMap();
// 單層迴圈,時間複雜度為 O(n)
for (var i = 0; i < size; i++) {
if (dic.containsKey(target - nums[i])) {
return [dic[target - nums[i]]!, i];
}
dic.putIfAbsent(nums[i], () => i);
}
return [0];
}
two_sum.rs
/* 方法二:輔助雜湊表 */
pub fn two_sum_hash_table(nums: &Vec<i32>, target: i32) -> Option<Vec<i32>> {
// 輔助雜湊表,空間複雜度為 O(n)
let mut dic = HashMap::new();
// 單層迴圈,時間複雜度為 O(n)
for (i, num) in nums.iter().enumerate() {
match dic.get(&(target - num)) {
Some(v) => return Some(vec![*v as i32, i as i32]),
None => dic.insert(num, i as i32),
};
}
None
}
two_sum.c
/* 雜湊表 */
typedef struct {
int key;
int val;
UT_hash_handle hh; // 基於 uthash.h 實現
} HashTable;
/* 雜湊表查詢 */
HashTable *find(HashTable *h, int key) {
HashTable *tmp;
HASH_FIND_INT(h, &key, tmp);
return tmp;
}
/* 雜湊表元素插入 */
void insert(HashTable *h, int key, int val) {
HashTable *t = find(h, key);
if (t == NULL) {
HashTable *tmp = malloc(sizeof(HashTable));
tmp->key = key, tmp->val = val;
HASH_ADD_INT(h, key, tmp);
} else {
t->val = val;
}
}
/* 方法二:輔助雜湊表 */
int *twoSumHashTable(int *nums, int numsSize, int target, int *returnSize) {
HashTable *hashtable = NULL;
for (int i = 0; i < numsSize; i++) {
HashTable *t = find(hashtable, target - nums[i]);
if (t != NULL) {
int *res = malloc(sizeof(int) * 2);
res[0] = t->val, res[1] = i;
*returnSize = 2;
return res;
}
insert(hashtable, nums[i], i);
}
*returnSize = 0;
return NULL;
}
two_sum.kt
/* 方法二:輔助雜湊表 */
fun twoSumHashTable(nums: IntArray, target: Int): IntArray {
val size = nums.size
// 輔助雜湊表,空間複雜度為 O(n)
val dic = HashMap<Int, Int>()
// 單層迴圈,時間複雜度為 O(n)
for (i in 0..<size) {
if (dic.containsKey(target - nums[i])) {
return intArrayOf(dic[target - nums[i]]!!, i)
}
dic[nums[i]] = i
}
return IntArray(0)
}
two_sum.zig
// 方法二:輔助雜湊表
fn twoSumHashTable(nums: []i32, target: i32) !?[2]i32 {
var size: usize = nums.len;
// 輔助雜湊表,空間複雜度為 O(n)
var dic = std.AutoHashMap(i32, i32).init(std.heap.page_allocator);
defer dic.deinit();
var i: usize = 0;
// 單層迴圈,時間複雜度為 O(n)
while (i < size) : (i += 1) {
if (dic.contains(target - nums[i])) {
return [_]i32{dic.get(target - nums[i]).?, @intCast(i)};
}
try dic.put(nums[i], @intCast(i));
}
return null;
}
視覺化執行
此方法透過雜湊查詢將時間複雜度從 \(O(n^2)\) 降至 \(O(n)\) ,大幅提升執行效率。
由於需要維護一個額外的雜湊表,因此空間複雜度為 \(O(n)\) 。儘管如此,該方法的整體時空效率更為均衡,因此它是本題的最優解法。