Arrays_Strings 判断两个字符串是否有相同的字符 @CareerCup

本文介绍了一种通过排序和计数方法判断两个字符串是否为变位词的技术,并提供了具体的Java实现代码示例。

原文:

Write a method to decide if two strings are anagrams or not.

译文:

写一个函数判断两个字符串是否是变位词。


方法1:对两个字符串分别排序,然后判断是否相等。但会破坏原字符串 Time: O(nlogn)

方法2:用一个O(1)的额外空间来记录,每个字符出现的次数。不会破坏原字符串 Time: O(n)



package Arrays_Strings;

import java.util.Arrays;

public class S1_3 {

	public static String sort(String s) {
		char[] content = s.toCharArray();
		Arrays.sort(content);
		return new String(content);
	}
	
	// 方法1:用给字符串排序的方法,但会破坏原字符串
	public static boolean permutation(String s, String t) {
		return sort(s).equals(sort(t));
	}
	
	// 用额外空间来存储每个char出现的次数
	public static boolean isAnagram(String s, String t) {
		if(s.length() != t.length()) {
			return false;
		}
		
		int[] letters = new int[256];
		for(int i=0; i<s.length(); i++) {
			letters[s.charAt(i)]++;
		}
		
		for(int i=0; i<t.length(); i++) {
			letters[t.charAt(i)]--;
			if(letters[t.charAt(i)] < 0){
				return false;
			}
		}
		return true;
	}
	
	public static void main(String[] args) {
		String[][] pairs = {{"apple", "papel"}, {"carrot", "tarroc"}, {"hello", "llloh"}};
		for (String[] pair : pairs) {
			String word1 = pair[0];
			String word2 = pair[1];
			boolean anagram = permutation(word1, word2);
			System.out.println(word1 + ", " + word2 + ": " + anagram);
			System.out.println(isAnagram(word1, word2));
		}
	}
}




面试题,是纸上写的,发现了些错误,回来改进了下。写纸上和写计算机里并编译成功完全是两个效果。 开始没太多字符串操作,很繁琐、难点也多,后逐渐改进。 典型问题1: sizeof()局限于栈数组 char a[] = "asd213123123"; 形式,并且这种不能用'\0'判断是否结束(这种判断方式能很方便加在while条件中用于判断越界——b != '\0')。 如果是字符串常量: char *b = "dasadafasdf"; 这种情况,sizeof()就废掉了! 总之: 对号入座,前者sizeof、后者strlen~!不过sizeof(a)和strlen(b)还有另外一个区别,strlen不计算'\0',而sizeof要计算(前提是sizeof()不针对char指针) 典型问题2: 用什么来暂存并输出结果?还是只是记录下来相关位置——这是我底下未完成版本1想到的思路——用一个count[sizeof(A)]数组记录下A每个位置作为起点所能和B达到的最大重合,最后判断查找数组中最大值,此时目标子字符串的起点下标(i)和 i 对应的长度(counter[i])都有了。 这是针对不知道字符串大小并且不占用额外空间的做法,需要非常繁琐的操作,要加很多标记,越界判断也会有些麻烦(结合优势么,用字符串常量而不是栈空间中的字符数组,有'\0'——就好判断了!) (关于空间的占用,如果要用一个和字符串a一样长的数组counter来计录a中各起点对应与b最大重合子字符串,这个数组也要和a一样长,空间上也不合适,除非情形很特殊,a短b长,不然不如直接malloc()一个堆空间来储存当前最长“子字符串”,并实时更新) 先放一个改完编译测试成功的。 release1 //题目:要求比较A字符串(例如“abcdef"),B字符串(例如(bdcda)。找出重合度最大的子字符串,输出(根据OJ经验,输>出结果对即可) #include #include #include main(){ char *A = "abcderfghi"; char *B = "aderkkkkkabcd"; int i,j,c = 0,count = 0; unsigned int maxSeg = 0; int max = strlen(A) > strlen(B) ? strlen(A) : strlen(B); char* final = (char*)malloc(sizeof(char) * (max + 1)); final[max] = '\0'; for(i = 0;A[i] != '\0';i++){ for(j = 0;B[j] != '\0';j++){ while(A[i + c] == B[j] && A[i+c] != '\0' && B[j] != '\0'){ count++; c++; j++; }                         if(count > maxSeg){                                 strncpy(final,(A + i),count);                                 maxSeg = count;                         } count = 0; c = 0; } } printf("%s\n",final); free(final); } 这是能将就用的第一个版本~!关于结束符'\0'能否影响free()的使用,觉得是完全不用操心的,因为malloc的大小是系统来保存的,删除时候系统来接手就完了,而'\0'结束符只是针对一些常规字符串操作,比如printf()用%s控制输出时~! 新难点:找到的子字符串同时一样长怎么办?那我这只能叫做”第一个最长的重合字符串“用两块空间来存储?三段等长怎么办? 如: "abclbcdlcdel" "kabckbcdkcde" abc长3,bcd长3,cde长3。。。 未完成版本1:这段是错误示范,初期定位模糊思路乱,有些函数和功能不把握,又在纸上写。 思路乱的一个后果就是前期想用i和j简单判断越界问题,后期又弄了i+c之类的下标, 修改思路: 把字符串换成“字符串常量”——带'\0'的,这样在小while中用 != '\0'就能判断出界问题。 把字符串变成字符串常量以后的另一个问题是sizeof不能用了,引入string.h,用strlen()替代即可。 //题目:要求比较A字符串(例如“abcdef"),B字符串(例如(bdcda)。找出重合度最大的子字符串,输出(根据OJ经验,输出结果对即可) //遗忘,未使用string.h相关函数。 #include main(){ char A[] = "asdasd"; char B[] = "asdasd"; /*本版本处理方式为最通用的针对字符串大小未知情况的遍历——比如“字符串常量”——此时可用strlen()代替sizeof(),并引入即可。 *但是因在纸上做题,在条件上做了简化————使用了sizeof()可确定大小的字符数组而非“字符串常量”。具体用sizeof()还是strlen()。这些小问题请读者自行区分。 *如果可用sizeof()确定大小,就可以用malloc()创建一个临时字符串来存储并输出最大字符子段,代码会简化很多~! *不过如果用malloc()保存最大子段,随着最大子段变化,需要不停的free()再重新malloc(),要注意 */ int i,j,flag,c = 0,temp = 0,max = 0,count[sizeof(A)]; for(i = 0;i < sizeof(A);i++){//以i为A中“子字符串”首位,遍历B,看B中与A[i]起的子字符串最大匹配数量是多少,记为count[i],每个count[i]对应A中一个字符 for(j = 0;j count[i])//找出B中匹配度最高子段,不用记录下标,只需记录匹配的字符数量,A[i]是固定的起点,加上偏移量,就是这段 count[i] = temp; } //清零,准备面对新的起点j~!以j为起点再找匹配的一段字符串 //j不用恢复~!恢复原样的话,算上j++是移动了一位,不会死循环~!但是,因为这一段本来就是连续的,abcd都连续了,bcd和cd不用看了。 temp = 0; c = 0; } } //比较count数组,看哪个i对应子段越大 //temp = 0;//节省空间的考虑(虽然只有4B),怕不适应就改叫max,去声明一个max变量。 for(i = 0;i max){//找出最大的一个计数器~~~~并记录i!!! max = count[i];//这句可以精简掉,可能?不可以,作为“下标”可以被精简,因为有了flag~!但作为max不能少,做比较用——叫max比较好理解。 flag = i;//用flag记录相应最大子段的起始偏移量 } //输出该子段 for(i = flag;i < flag + count[flag];i++){//temp来源于前一个for循环,意为最大偏移量。 printf("%c",A[i]); } printf("\n"); } ———————————————— 版权声明:本文为优快云博主「秦伟H」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。 原文链接:https://blog.youkuaiyun.com/huqinwei987/article/details/25316699
在C语言中,如果两个字符数组未以`\0`终止,使用`strcmp`函数进行比较时会导致未定义行为。`strcmp`的设计前提是输入的字符数组是以`\0`结尾的字符串,它通过逐个字符比较,直到遇到第一个`\0`为止[^2]。因此,如果两个字符数组中均未包含`\0`,`strcmp`会继续访问后续内存,直到偶然遇到一个`\0`为止,这可能导致以下几种情况: - **越界访问**:函数会访问数组之外的内存区域,导致不可预测的结果。 - **程序崩溃**:若访问了受保护的内存区域,程序可能会异常终止。 - **比较结果不可靠**:即使程序未崩溃,返回值也无法准确反映两个字符数组的真实内容差异。 --- ### 正确判断两个不以`\0`终止的字符数组是否相同的方法 为了正确判断两个字符数组是否内容相同,必须提供额外的信息,例如数组的长度。由于字符数组未以`\0`结束,无法依赖`strlen`或`strcmp`等依赖`\0`的函数,而应手动逐个比较字符。 #### 示例代码: ```c #include <stdio.h> #include <string.h> int arrays_equal(const char *a, const char *b, size_t length) { for (size_t i = 0; i < length; i++) { if (a[i] != b[i]) { return 0; // 不相等 } } return 1; // 相等 } int main() { char a[4] = {'a', 'b', 'c', 'd'}; char b[4] = {'a', 'b', 'c', 'd'}; char c[4] = {'a', 'b', 'c', 'e'}; if (arrays_equal(a, b, 4)) { printf("a 和 b 内容相同\n"); } else { printf("a 和 b 内容不同\n"); } if (arrays_equal(a, c, 4)) { printf("a 和 c 内容相同\n"); } else { printf("a 和 c 内容不同\n"); } return 0; } ``` 该方法通过指定长度,确保逐个字符比较,避免了对`\0`的依赖,从而实现安全、准确的比较。 --- ### 手动添加`\0`作为字符串终止符的替代方案 如果允许修改字符数组的内容,可以手动添加`\0`,使其成为标准字符串,从而可以使用`strcmp`进行比较: ```c char a[5] = {'a', 'b', 'c', 'd', '\0'}; char b[5] = {'a', 'b', 'c', 'd', '\0'}; if (strcmp(a, b) == 0) { printf("a 和 b 内容相同\n"); } ``` 此方法适用于可以修改数组内容的情况,且能保证字符串操作函数的兼容性[^1]。 --- ### 总结 当字符数组未以`\0`终止时,不能使用`strcmp`或`strlen`等标准字符串函数,而应通过手动指定长度的方式进行比较。若条件允许,可手动添加`\0`,使字符数组成为合法的字符串,从而兼容标准库函数。 ---
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值