关于在字符串中删除特定的字符

本文介绍了一种高效的方法来从一个字符串中删除指定字符,通过预处理查找字符并使用双指针技术进行删除,同时提供了两种实现方法,一种是在删除时移动后续字符,另一种是使用哈希表快速查找和删除字符。
 

题目:输入两个字符串,从第一字符串中删除第二个字符串中所有的字符。例如,输入”They are students.”和”aeiou”,则删除之后的第一个字符串变成”Thy r stdnts.”。

 

分析:这是一道微软面试题。在微软的常见面试题中,与字符串相关的题目占了很大的一部分,因为写程序操作字符串能很好的反映我们的编程基本功。

 

要编程完成这道题要求的功能可能并不难。毕竟,这道题的基本思路就是在第一个字符串中拿到一个字符,在第二个字符串中查找一下,看它是不是在第二个字符串中。如果在的话,就从第一个字符串中删除。但如何能够把效率优化到让人满意的程度,却也不是一件容易的事情。也就是说,如何在第一个字符串中删除一个字符,以及如何在第二字符串中查找一个字符,都是需要一些小技巧的。

 

首先我们考虑如何在字符串中删除一个字符。由于字符串的内存分配方式是连续分配的。我们从字符串当中删除一个字符,需要把后面所有的字符往前移动一个字节的位置。但如果每次删除都需要移动字符串后面的字符的话,对于一个长度为n的字符串而言,删除一个字符的时间复杂度为O(n)。而对于本题而言,有可能要删除的字符的个数是n,因此该方法就删除而言的时间复杂度为O(n2)

 

事实上,我们并不需要在每次删除一个字符的时候都去移动后面所有的字符。我们可以设想,当一个字符需要被删除的时候,我们把它所占的位置让它后面的字符来填补,也就相当于这个字符被删除了。在具体实现中,我们可以定义两个指针(pFastpSlow),初始的时候都指向第一字符的起始位置。当pFast指向的字符是需要删除的字符,则pFast直接跳过,指向下一个字符。如果pFast指向的字符是不需要删除的字符,那么把pFast指向的字符赋值给pSlow指向的字符,并且pFastpStart同时向后移动指向下一个字符。这样,前面被pFast跳过的字符相当于被删除了。用这种方法,整个删除在O(n)时间内就可以完成。

 

接下来我们考虑如何在一个字符串中查找一个字符。当然,最简单的办法就是从头到尾扫描整个字符串。显然,这种方法需要一个循环,对于一个长度为n的字符串,时间复杂度是O(n)

 

由于字符的总数是有限的。对于八位的char型字符而言,总共只有28=256个字符。我们可以新建一个大小为256的数组,把所有元素都初始化为0。然后对于字符串中每一个字符,把它的ASCII码映射成索引,把数组中该索引对应的元素设为1。这个时候,要查找一个字符就变得很快了:根据这个字符的ASCII码,在数组中对应的下标找到该元素,如果为0,表示字符串中没有该字符,否则字符串中包含该字符。此时,查找一个字符的时间复杂度是O(1)。其实,这个数组就是一个hash表。这种思路的详细说明,详见本面试题系列的第13题。

 

#include <stdio.h>

#include <conio.h>

 

char TheArray[256];

 

void InitTheArray(const char * szFind)

{

    while('\0'!=*szFind)

        TheArray[*szFind++] = 1;

}

 

void ProcessTheString(char * szDestination)

{

    char * pFast;

    char * pSlow;

 

    pFast = pSlow = szDestination;

    

    while ('\0'!=*pFast)

    {

        if(0==TheArray[*pFast])

            *pSlow++ = *pFast++;        

        else

            pFast++;

    }

 

    *pSlow = '\0';

}

 

int main()

{

    char szDes[] = "They are Students.";

    char szFind[] = "aeiou";

    

    InitTheArray(szFind);

    ProcessTheString(szDes);

 

    printf("%s", szDes);

 

    _getch();

    return 0;

}

 

 

本文来自优快云博客,转载请标明出处:http://blog.youkuaiyun.com/shunshine988/archive/2009/06/14/4268106.aspx

 

 

 

从一个字符串中删除制定字符

第一种:

 

#include <stdio.h>

#define M 100

void delchar(char ch[],char c)

{

    int i,j,flag=0;

    char d[M];

    for (i=0,j=0;ch[i]!='\0';i++)

 if (ch[i]!=c)

     {

  d[j]=ch[i];

                j++;

                flag=(flag||0);

         }

 else

     {

  flag=(flag||1);

 

     }

    d[j]='\0';

    if (flag==0)

 printf("No this char in the string!\n\n");

    printf("The result is:");

    puts(d);

}

main()

{

    char str[M],ch;

 

    printf("Input a str:");

    gets(str);

    printf("\n");

    printf("Input a char to del:");

    ch=getchar();

    printf("\n");

    delchar(str,ch);

    putchar('\n');

    system("pause");

    clrscr();

}

 

第二种:

 

#include <stdio.h>

#define M 100

void delchar(char ch[],char c)

{

    int i,j,flag=0;

    for (i=0;ch[i]!='\0';)

 if (ch[i]==c)

     {

  for (j=i;ch[j]!='\0';j++)

      {

   ch[j]=ch[j+1];

   flag=(flag||1);

      }

  i=0;

      }

 else

     {

  flag=(flag||0);

  i++;

     }

    if (flag==0)

 printf("No this char in the string!\n\n");

}

void loop(int d)

{

    char str[M]="fjhfkhfkhhkjkjh",ch;

    switch(d)

    {

    case 1:

    {

    printf("Input a str:");

    gets(str);

    printf("\n");

    printf("Input a char to del:");

    ch=getchar();

    printf("\n");

    delchar(str,ch);

    printf("The result is:");

    puts(str);

    putchar('\n');

    system("pause");

    clrscr();

    /*choice();*/

    break;

    }

    case 2:

    {

    ch=getchar();

    delchar(str,ch);

    printf("The result is:");

    puts(str);

    putchar('\n');

    system("pause");

    /*choice();*/

    break;

    }

    case 0:exit(0);

    default:{printf("Error!\n");system("pause");}

    }

}

choice(void)

{

    int c;

    printf("Please input your choice:(n/o/e)");

    scanf("%d",&c);

    loop(c);

}

main()

{

    choice();

}

 

 

本文来自: <a href=http://www.c-home.cn>[C编程网]</a> 详细出处参考:<a href=http://www.c-home.cn/showart.asp?id=82>http://www.c-home.cn/showart.asp?id=82</a>

 

 

转自: http://blog.chinaunix.net/space.php?uid=21289517&do=blog&cuid=2051477

<think>我们需要删除字符串中的特定字符串。可以使用Python的字符串替换方法,但要注意如果特定字符串是子串,可能会误删其他单词中的部分。因此,如果需要精确匹配整个单词,可能需要使用正则表达式。 如果只是简单删除所有出现的子串(不区分单词边界),可以直接使用replace。 如果需要删除整个单词,则要使用正则表达式,确保匹配的字符串是独立的单词(即前后有边界)。 这里提供两种场景的解决方案: 1. 删除所有出现的子串(无论是否独立单词) 2. 只删除独立的单词(即匹配整个单词) 同时考虑删除多个特定字符串的情况。 我们编写两个函数: - 函数1:简单删除所有出现的子串(使用replace) - 函数2:使用正则表达式删除整个单词 注意:如果特定字符串包含正则元字符,需要转义。 示例: 输入字符串:"Hello world, this is a test string. Welcome to the world of Python." 删除特定字符串列表:['world', 'test'] 期望输出1(删除所有子串): "Hello , this is a string. Welcome to the of Python." 期望输出2(删除整个单词): "Hello , this is a string. Welcome to the of Python." (注意:world, 中的world因为后面有逗号,所以不是独立单词?这取决于定义,通常单词边界包括空格、标点等。但正则表达式中的\b可以匹配单词边界,包括标点符号前的位置,但注意标点符号本身不是边界的一部分。因此,我们需要考虑匹配整个单词,并且删除后保留边界(即删除单词和它相邻的边界?实际上,我们删除整个单词,包括它两边的边界?不,我们只删除单词,然后留下空格。但这样可能会留下多余空格。所以我们需要处理空格。 我们设计第二个函数:删除独立单词,并且删除后合并多余空格(避免出现连续两个空格)。 具体实现如下:</think>### 在长字符串删除特定字符串的Python实现 #### 高效解决方案: 使用Python内置的`str.replace()`方法是最简单高效的方式,特别适合处理长字符串: ```python def remove_substrings(text, targets): """ 从长字符串删除多个特定字符串 :param text: 原始长字符串 :param targets: 要删除的子字符串列表 :return: 处理后的字符串 """ for target in targets: text = text.replace(target, '') return text # 示例用法 long_text = "这是一个示例字符串,需要删除'删除我'和'不需要的内容'等特定部分。" targets_to_remove = ["删除我", "不需要的内容", "特定部分"] result = remove_substrings(long_text, targets_to_remove) print(result) # 输出:这是一个示例字符串,需要''和''等。 ``` #### 进阶方案(处理复杂情况): 当需要更精确的控制(如大小写敏感、正则匹配)时: ```python import re def advanced_remove(text, patterns, flags=0): """ 使用正则表达式删除匹配内容 :param text: 原始字符串 :param patterns: 正则模式列表 :param flags: 匹配标志(如re.IGNORECASE) :return: 处理后的字符串 """ for pattern in patterns: text = re.sub(pattern, '', text, flags=flags) return text # 示例用法 text = "Python是pythonic的语言,PYTHON很强大!" patterns = [r"python", r"强大[!]?"] # 正则表达式列表 # 不区分大小写删除 result1 = advanced_remove(text, patterns, flags=re.IGNORECASE) print(result1) # 输出:是ic的语言,很! # 区分大小写删除 result2 = advanced_remove(text, patterns) print(result2) # 输出:Python是pythonic的语言,PYTHON很! ``` #### 性能优化技巧: 1. **单次遍历法**(适用于删除多个子串): ```python def remove_multiple(text, targets): """单次遍历删除多个子串""" parts = [] start = 0 while start < len(text): found = False for target in targets: if text.startswith(target, start): start += len(target) # 跳过目标字符串 found = True break if not found: parts.append(text[start]) start += 1 return ''.join(parts) ``` 2. **超大文本处理**(使用生成器): ```python def stream_remove(text, targets, chunk_size=4096): """分块处理超大文本""" buffer = "" for i in range(0, len(text), chunk_size): buffer += text[i:i+chunk_size] for target in targets: buffer = buffer.replace(target, '') yield buffer[:-max(len(t) for t in targets)] # 保留可能被截断的部分 buffer = buffer[-max(len(t) for t in targets):] # 保留边界字符 yield buffer # 使用示例 huge_text = "..." # 超长文本 for chunk in stream_remove(huge_text, ["delete_me", "remove_this"]): process(chunk) # 逐块处理 ``` #### 关键考量: 1. **简单替换**:`str.replace()` 适合大多数场景 2. **复杂匹配**:使用正则表达式(`re.sub`) 3. **性能优化**:对于GB级文本,使用分块处理 4. **边界情况**:注意删除后空格合并(`" ".join(result.split())`)
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值