资源来源于 LeetCode127——Word Ladder。题目描述如下:
以题目给出的例子为例,其实就是在所有路径的权重都为1的情况下求出下列无向图中从节点 hit 到节点 cog 的最短路径:
Postscript:图中相互之间只相差一个字母的单词都是相邻节点。
这个就是图论算法中的单源最短路,求单源最短路比较通用的算法是 BFS 和 Dijkstra 算法,其区别是 BFS 不能用于带权重的图中, 而后者可以,可以看出在本题中两个字符串之间是无权重的, 也就是如果连通就是1, 不联通就是无穷。BFS 和 Dijkstra 的区别是前者的时间复杂度是 O(n), 后者最多优化到 O(mlogn),所以如果条件成立一般选择 BFS 要更好。
先贴代码:
int ladderLength(string beginWord, string endWord, vector<string>& wordList) {
unordered_set<string> wordSet;
for (int i = 0; i < wordList.size(); i ++) {
wordSet.insert(wordList[i]);
}
queue<pair<string, int>> que;
que.push(make_pair(beginWord, 1));
while (!que.empty()) {
auto val = que.front();
que.pop();
if (val.first == endWord) {
return val.second;
}
for (int i = 0; i < val.first.size(); i ++) {
string str = val.first;
for (int j = 0; j < 26; j ++) { // 替换当前节点的单词current每个字符(从a~z),然后看看替换过后的单词是否在单词表中
str[i] = 'a'+j;
if (wordSet.count(str) == 1) {
que.push(make_pair(str, val.second+1));
wordSet.erase(str);
}
}
}
}
return 0;
}
笔者最开始的方法是把当前节点的单词 current 和 wordList 里面的所有词比较,不相同的字符的个数为1的时候 return true,否则return false。这样做的缺点是,不论如何都要遍历完整个wordList,查找时间复杂度是 O(n),提交会提示超时。
在判断两个节点是否临接这个步骤中,有个提高效率的技巧,替换当前节点的单词 current 每个字符(从a~z),然后看看替换过后的单词是否在单词表中,由于我们是用 unordered_set 来保存单词表,虽然最坏情况下的时间复杂度会到O(n),但一般情况下是可以在常数时间O(1)下访问的,因此使用 unordered_set::find 的时间复杂度是要低于线性时间复杂度的,这样就提高了效率。
unordered_set 是 C++ 11 中新加的容器,其内部实现与 set 大有不同, set 内部实现是基于 RB-Tree,而 unordered_set 内部实现是基于哈希表,该容器允许基于值的快速元素检索,同时也支持正向迭代。