记录D7-23.5.23

文章介绍了LeetCode(LC)中的两道字符串处理题目,包括左旋转字符串的解决方案,使用反转字符串的方法来达到目标。另一部分重点讲解了KMP算法,用于高效地进行字符串匹配,避免暴力回退,通过构建前缀表实现动态匹配,提高效率。

LC剑指58 左旋转字符串

这道题比较简单,主要是以前做过一遍了。以题目的示例1来看s=abcdefg, k=2

  1. 先反转前k个字符串,为bacdefg
  2. 将整个字符串进行反转,为gfedcab
  3. 然后反转前面的s.size()-n个字符串,为cdefgab
    整体的代码为
class Solution {
public:
    void reverse(string& s,int start, int end){
        for(int i=start, j=end;i<j;i++,j--){
            swap(s[i],s[j]);
        }
    }
    string reverseLeftWords(string s, int n) {
        reverse(s, 0, n-1);
        reverse(s, 0, s.size()-1);
        reverse(s, 0, s.size()-1-n);
        return s;
    }
};

LC28 找出字符串中第一个匹配项的下标

这里学习一下KMP算法,主要看两个博主的博客:labuladong代码随想录

pat表示模式串,长度为M。txt表示文本串,长度为N。
字符串匹配可以用暴力的方法,对于出现不匹配的字符,同时回退txt和pat的指针。

// 暴力匹配(伪码)
int search(String pat, String txt) {
    int M = pat.length;
    int N = txt.length;
    for (int i = 0; i <= N - M; i++) {
        int j;
        for (j = 0; j < M; j++) {
            if (pat[j] != txt[i+j])
                break;
        }
        // pat 全都匹配了
        if (j == M) return i;
    }
    // txt 中不存在 pat 子串
    return -1;
}

但是如果字符串中重复的字符比较多,那么txt中根本就不需要回退这么多字符。比如txt="aaacaaab", pat="aaab"。pat中根本没有字符c,也就没必要回退指针i。

KMP算法会花费一些空间来记录一些消息,相当于用空间换时间。

KMP 算法永不回退txt的指针i,不走回头路(不会重复扫描txt),而是借助dp数组中储存的信息把pat移到正确的位置继续匹配,时间复杂度只需 O(N),用空间换时间,所以我认为它是一种动态规划算法。——labuladong

KMP就是一种有限状态自动机,这东西以前在学编译原理的时候学过,虽然忘了,但是大概的思路还是比较简单的。主要是要构造状态转移图。要确定状态转移的行为,得明确两个变量,一个是当前的匹配状态,另一个是遇到的字符;确定了这两个变量后,就可以知道这个情况下应该转移到哪个状态。
引用自labuladong文章
为了描述状态转移图,要定义一个二维的dp数组。
//================分隔符-------------------------------
在代码随想录的文章中,不是用状态机来实现的,是用前缀表的方法。不过我感觉也差不多,都是找到当下一个字符不满足要求时应该回退的状态的位置。前缀表的实现主要要找到最长相等前后缀。具体的可以去看一下视频。

构造前缀表的流程主要分为4部分:

  1. 初始化
  2. 前后缀不相同情况
  3. 前后缀相同情况
  4. 更新next表
class Solution {
public:
    void getNext(int* next, const string& s){
        //1.初始化
        int j=0;
        next[0]=0;
        for(int i=1;i<s.size();i++){//i在j后面
            //2.前后缀不同情况
            while(j>0 && s[i]!=s[j]){
                j=next[j-1];//j回退到矛盾前一个的状态
            }
            //3.前后缀相同
            if(s[i]==s[j]){
                j++;
            }
            //4.更新next
            next[i]=j;
        }
    }
    int strStr(string haystack, string needle) {
        if(needle.size()==0){
            return 0;
        }
        int next[needle.size()];
        getNext(next,needle);
        int j=0;//j 指向模式串起始位置,i指向文本串起始位置。
        for(int i=0;i<haystack.size();i++){
            while(j>0 && haystack[i]!=needle[j]){
                j=next[j-1];//如果字符不同项,j要从next数组中寻找下一个匹配的位置。
            }
            if(haystack[i]==needle[j]){
                j++;//字符相同,则同时向后移动
            }
            if(j==needle.size()){
                return i-needle.size()+1;
            }
        }
        return -1;
    }
};

但是KMP好复杂…以后再看吧

看了leetcode上的题解,用双指针尝试一下,比暴力稍微好一点。

class Solution {
public:
    int strStr(string haystack, string needle) {
        int m=haystack.size();
        int n=needle.size();
        for(int i=0,j=0;i<m;i++){
            if(haystack[i]==needle[j]){
                j++;
                if(j==n){
                    return i-n+1;
                }
            }
            else{
                i=i-j;//如果没有匹配上,i指针要回退
                j=0;
            }
        }
        return -1;
    }
};
xray-persist-service.log:2025-10-27T09:06:09.953Z [jfxps] [INFO ] [7ef963a50172a0b9] [persist_worker:192 ] [persistRegular ] Persist worker id 6 is processing message from persistRegular --> created pypi-remote-cache/d3/18/134efef03138ba351827bcbc97c62e23f2445e769c20d7f243b6b9d7687d/cs-3.4.0-py2.py3-none-any.whl (sha256: 1e3bbd147a1509f995808a8c9fd0e6db1c6637f9dbe06e56fddd877eec879588) xray-persist-service.log:2025-10-27T09:06:10.010Z [jfxps] [INFO ] [7ef963a50172a0b9] [storage_service:373 ] [persistRegular ] Persisting component graph pypi://cs:3.4.0 to graph db xray-persist-service.log:2025-10-27T09:06:10.197Z [jfxps] [INFO ] [7ef963a50172a0b9] [persist_worker:268 ] [persistRegular ] Persist worker id 6 has completed to process message created pypi-remote-cache/d3/18/134efef03138ba351827bcbc97c62e23f2445e769c20d7f243b6b9d7687d/cs-3.4.0-py2.py3-none-any.whl (sha256: 1e3bbd147a1509f995808a8c9fd0e6db1c6637f9dbe06e56fddd877eec879588) (elapsed: 0.248s) xray-policyenforcer-service.log:2025-10-27T09:06:10.465Z [jfxpe] [INFO ] [7ef963a50172a0b9] [policy_enforcer_worker:243 ] [policyEnforcer ] PolicyEnforcer worker processing message Workflow: scan, Subject: cs-3.4.0-py2.py3-none-any.whl, Source: default/pypi-remote-cache/d3/18/134efef03138ba351827bcbc97c62e23f2445e769c20d7f243b6b9d7687d/ (SCA) xray-policyenforcer-service.log:2025-10-27T09:06:10.530Z [jfxpe] [INFO ] [7ef963a50172a0b9] [scan_status_service:286 ] [policyEnforcer ] Scan status record updated for: artifact at path pypi-remote-cache/d3/18/134efef03138ba351827bcbc97c62e23f2445e769c20d7f243b6b9d7687d/cs-3.4.0-py2.py3-none-any.whl, OverallStatus from: PENDING to DONE at: 2025-10-27T09:06:10Z, StatusSource: violations, source: sca, from status: PENDING to status: NOT_SCANNED, took: 9.90443ms xray-policyenforcer-service.log:2025-10-27T09:06:10.537Z [jfxpe] [INFO ] [7ef963a50172a0b9] [policy_enforcer_worker:294 ] [policyEnforcer ] PolicyEnforcer worker finished processing message Workflow: scan, Subject: cs-3.4.0-py2.py3-none-any.whl, Source: default/pypi-remote-cache/d3/18/134efef03138ba351827bcbc97c62e23f2445e769c20d7f243b6b9d7687d/ (elapsed: 0.072s) (SCA) xray-request.log:2025-10-27T09:06:0 按2025-10-27T09:06:10.537Z 字段排序
10-28
在处理包含时间字段(如 `2025-10-27T09:06:10.537Z`)的日志记录内容排序时,有多种方法可供选择。 ### 使用 Linux 的 `sort` 命令 如果日志文件在 Linux 系统中,且时间字段格式统一,可直接使用 `sort` 命令。若时间字段在每行开头,可使用以下命令进行升序排序: ```bash sort xray-persist-service.log > sorted_xray-persist-service.log ``` 如果需要降序排序,添加 `-r` 选项: ```bash sort -r xray-persist-service.log > sorted_xray-persist-service.log ``` 若时间字段不在每行开头,假设时间字段是每行的第 3 个字段(以空格分隔),可使用 `-k` 选项指定字段位置进行排序: ```bash sort -k3 xray-persist-service.log > sorted_xray-persist-service.log ``` 降序排序则为: ```bash sort -r -k3 xray-persist-service.log > sorted_xray-persist-service.log ``` ### 使用 Python 脚本 也可以编写 Python 脚本对日志文件进行排序,以下是示例代码: ```python with open('xray-persist-service.log', 'r') as file: lines = file.readlines() # 按时间字段排序 lines.sort(key=lambda line: line.split()[0]) with open('sorted_xray-persist-service.log', 'w') as file: file.writelines(lines) ``` 在上述代码中,`line.split()[0]` 假设时间字段在每行的第一个位置。如果时间字段不在第一个位置,需要修改索引值。 ### 使用 Logstash 若使用 Logstash 处理日志,可在配置文件中添加排序逻辑。以下是一个简单的 Logstash 配置示例: ``` input { file { path => "xray-persist-service.log" start_position => "beginning" } } filter { grok { match => { "message" => "%{TIMESTAMP_ISO8601:timestamp} %{GREEDYDATA:rest}" } } mutate { convert => { "timestamp" => "date" } } } output { sort { field => "@timestamp" } file { path => "sorted_xray-persist-service.log" } } ``` 在上述配置中,`grok` 过滤器用于提取时间字段,`mutate` 过滤器将时间字段转换为日期类型,`sort` 过滤器按时间字段排序,最后将排序后的日志输出到文件中。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值