划分字母区间
字符串 S 由小写字母组成。我们要把这个字符串划分为尽可能多的片段,同一字母最多出现在一个片段中。返回一个表示每个字符串片段的长度的列表。
示例:
输入:S = “ababcbacadefegdehijhklij”
输出:[9,7,8]
解释:
划分结果为 “ababcbaca”, “defegde”, “hijhklij”。
每个字母最多出现在一个片段中。
像 “ababcbacadefegde”, “hijhklij” 的划分是错误的,因为划分的片段数较少。
贪心算法
为了满足贪心策略要先做一些预处理
由于同一个字母只能出现在同一个片段,显然同一个字母的第一次出现的下标位置和最后一次出现的下标位置必须出现在同一个片段。因此需要遍历字符串,得到每个字母最后一次出现的下标位置。
从左到右遍历字符串,遍历的同时维护当前片段的开始下标和结束下标 ,初始时 start=end=0。
对于每个访问到的字母 c,得到当前字母的最后一次出现的下标位置 endc,则当前片段的结束下标一定不会小于endc,因此令end=max{end.endc}
当访问到下标 end 时,当前片段访问结束,当前片段的下标范围是[start,end],长度为end−start+1,将当前片段的长度添加到返回值,然后令start=end+1继续寻找下一个片段。
重复上述过程 直到遍历完字符串
贪在寻找每个片段可能的最小结束下标,因此可以保证每个片段的长度一定是符合要求的最短长度,如果取更短的片段,则一定会出现同一个字母出现在多个片段中的情况。由于每次取的片段都是符合要求的最短的片段,因此得到的片段数也是最多的。
写的挺巧妙的 仔细看代码 时间复杂度O(n)遍历两次字符串 一次找最后出现的下标 一次划分字符串
class Solution {
public:
vector<int> partitionLabels(string S) {
int last[26];
int length = S.size();
for (int i = 0; i < length; i++) {
last[S[i] - 'a'] = i;
}
vector<int> partition;
int start = 0, end = 0;
for (int i = 0; i < length; i++) {
end = max(end, last[S[i] - 'a']);
if (i == end) {
partition.push_back(end - start + 1);
start = end + 1;
}
}
return partition;
}
};