763. Partition Labels(Medium)

该博客介绍了两种不同的方法来解决字符串中连续子串的问题。第一种方法利用区间排序和二维向量,记录每个字母的起始和结束位置,然后进行排序并合并重叠区间。第二种方法通过一次性遍历字符串,记录每个字母的最后出现位置,然后再次遍历以找到最长的连续子串。这两种方法都是高效地找出字符串中所有不包含重复字符的最长子串。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题目描述

解题思路: 本来是想继续用区间排序来解决重叠问题,但不知为啥不对,实在等不及了看了题解。

补题:

class Solution {
public:
    vector<int> partitionLabels(string s) {
        vector<vector<int> > local(26,vector<int>(2));//设置二维向量来存26个字母的起始
        for(int i = 0; i < 26; ++i){
            local[i][0] = 501;
        }//初始化
        for(int i = 0; i < s.size(); ++i){
            int num = s[i]-'a';
            if(local[num][0] == 501) local[num][0] = local[num][1] = i;
            else local[num][1] = i;
        }//遍历string取得区间值
        sort(local.begin(), local.end(), [](vector<int>& a, vector<int>& b){
            return a[0] < b[0];
        });//排序
        int start = local[0][0], end = local[0][1];
        vector<int> ans;
        for(int i = 1; i < 26; ++i){
            if(local[i][0] == 501) break;//排除没有出现的字母
            if(local[i][0] < end){
                end = max(end, local[i][1]);
            }//如果重叠,则扩大重叠长度
            else{
                ans.push_back(end - start +1);
                start = local[i][0];
                end = local[i][1];
            }
        }
        ans.push_back(end - start +1);//跳出循环后需要将最后一次结果push
        return ans;
    };
};

解题思路:先记录每个字母最后出现的位置,然后再遍历一次string。如果遍历到一个字母的最后位置的过程中没有出现比他后面的就记录当前长度再来。

class Solution {
public:
    vector<int> partitionLabels(string s) {
        int local[26], end=0, start=0;
        for(int i = 0; i < s.size(); ++i){
            local[s[i]-'a'] = i;
        }
        vector<int> ans;
        for(int i = 0; i < s.size(); ++i){
            end = max(local[s[i]-'a'], end);
            if(end == i){
                ans.push_back(end - start +1);
                start = i+1;
            }
        }
        return ans;
    }
};
在Hive中向一个分区表中插入数据,正确的命令是 **D、INSERT INTO... PARTITION** 或者 **B、INSERT OVERWRITE... PARTITION**。 ### 详细解释: #### 插入新数据(追加) 如果你想要向已有的分区表中添加新的记录而不覆盖现有的数据,可以使用 `INSERT INTO ... PARTITION` 命令。这会在现有数据的基础上增加新行。 ```sql INSERT INTO table_name PARTITION (partition_column='value') SELECT columns FROM source_table; ``` 这条命令适用于当你只需要追加新数据而不想删除原有内容的情况。 #### 覆盖已有数据 如果你希望完全替换某个分区内的所有旧有数据,则应选择 `INSERT OVERWRITE ... PARTITION`。该操作将会清空目标分区并加载新的结果集进去。 ```sql INSERT OVERWRITE TABLE table_name PARTITION (partition_column='value') SELECT columns FROM source_table; ``` 此方式适合于定期更新整个分区的数据场景下,如每日汇总等业务需求。 #### 错误选项分析 1. **A、INSERT APPEND... PARTITION** - Hive 中并没有直接叫做 `APPEND` 的关键字组合用于分区操作中。“append”的含义更贴近于“into”,所以在实际应用中我们通常采用 `INSERT INTO` 表达同样的意图。 2. **C、INSERT INTO VALUES.. PARTITION** - 在标准 SQL 和 HiveQL 中,`VALUES` 子句一般只出现在创建临时值列表的情况下,并不会跟 `PARTITION` 关键字一起工作来指定插入动作的目标位置。对于复杂的 ETL 流程来说,还是推荐通过 `SELECT` 查询的方式获取源端数据再进行装载更为合适。 总结而言,在处理分区表的数据插入时,应当依据是否保留原数据的需求分别选用适当的语句结构——即 `INSERT INTO ... PARTITION` 或者 `INSERT OVERWRITE ... PARTITION`。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值