uva11732 strcmp 字典树 存储

本文介绍了一种使用字典树优化字符串比较的方法,通过构建字典树来减少字符串两两比较所需的次数,并采用左儿子右兄弟表示法提高效率。

字典树,左儿子右孩子


//uva11732
//题目来源:UVa 11732 strcmp() Anyone?
//题意:求若干个字符串两两比较需要的次数 than 和 that 需要比7次 there和the
//需要7次 就是LCP的长度*2+1 特判2个字符串一样的情况abc和abc需要8次
//思路:利用字典树 每个点出现分叉的时候说明有些字符串可以比较出来了 
//总和加上当前深度*和当前节点不一样的兄弟数 链表超时了 学习了左儿子又兄弟表示法
#include <iostream>
#include <stdio.h>
#include <string.h>
using namespace std;

#define maxn 4000010

struct node
{
	char y;
    int son; //指向儿子
	int right; //指向右边的兄弟节点
    int sum ; //表示有多少个儿子
}trie[maxn];

int ch[123];
char str[1010];
int n , trie_s ;
long long  sum ;

void init()
{
	trie[0].son = trie[0].right = -1;
	trie[0].sum = 0;
	sum = 0;
	trie_s = 1;
}

void insert1()
{
    int i , j , k = strlen(str);
    //int x , y = 0;
    int u = 0;
	bool flag;
    for(i = 0; i <= k ; i++)
    {
		flag = false;
		for(j = trie[u].son ; j != -1 ; j = trie[j].right) //遍历u的儿子结点 
		{
			if(trie[j].y == str[i])
			{
				flag = true;
				break;
			}
		}
		if(!flag)
		{
			j = trie_s++;  //新开一个结点,作为u的第一个孩子 
			trie[j].right = trie[u].son; //插入到儿子右链表的表头 
			trie[j].y = str[i];
			trie[j].sum = 0;
			trie[j].son = -1;

			trie[u].son = j;
		}

        if(i == k) 
			{ sum += trie[u].sum+trie[j].sum; trie[j].sum++;} //特判结尾 Trie中不会进入结尾字符,需特判统计
        else
            sum += (trie[u].sum+trie[j].sum);
            
        trie[u].sum++;  //u的儿子数量加1 
        u = j;
    }
}

int main()
{
    int cas = 1;
    int i ;
    
    freopen("a.txt","r",stdin) ;
    while(scanf("%d" , &n) && n)
    {
		init();
        for(i = 1; i <= n; i++)
        {
            scanf("%s" , str);
            insert1();
        }
        cout<<"Case "<<cas++<<": ";
        cout<<sum<<endl;
    }
    return 0;
}
/*
2
a
b
4
cat
hat
mat
sir
0
*/


<think> 我们被要求回答:strcmp函数是否可用于进行字典序排序? 根据引用[1]:strcmp函数用于比较两个字符串,返回一个整数表示字典顺序关系。 引用[4]明确指出:strcmp比较字符串大小的原则类似字典序,返回值0表示相等,小于0表示第一个字符串小于第二个,大于0表示第一个大于第二个。 此外,引用[5]提供了一个具体示例,使用strcmp函数配合冒泡排序对字符串数组进行字典序排序。 因此,我们可以肯定地回答:strcmp函数可以用于字典序排序,因为它正是按照字典序比较字符串的。 下面详细解释: 1. strcmp的比较规则: - 逐个字符比较两个字符串的对应字符(按ASCII值)。 - 如果遇到不同的字符,则根据这两个字符的ASCII值大小决定字符串大小(即字典序)。 - 如果一直相同直到其中一个字符串结束,则较短的字符串小于较长的字符串。 2. 在排序算法中的应用: 如引用[5]所示,可以使用strcmp作为比较函数,结合冒泡排序(或其他排序算法)对字符串数组进行排序。 注意:strcmp区分大小写(因为大小写字母的ASCII值不同)。如果需要不区分大小写的排序,可以使用strcasecmp(非标准C,但常见于POSIX)或自定义比较函数。 结论:可以,strcmp函数就是为字典序排序设计的。 下面给出一个简单的示例代码,演示如何使用strcmp对字符串数组进行字典序排序(使用冒泡排序): </think> ### `strcmp` 函数在字典序排序中的应用 `strcmp` 函数**完全适用于字典序排序**。它是 C 语言标准库中专门设计用于字符串字典序比较的核心函数,通过逐个字符的 ASCII 值比较实现字典序规则[^1][^4]。 #### ✅ 实现原理 1. **字典序规则** 比较字符串 $s1$ 和 $s2$ 的对应字符: - 若 $s1[i]$ 的 ASCII 值 $<$ $s2[i]$ 的 ASCII 值 → 返回负值($s1 < s2$) - 若 $s1[i]$ 的 ASCII 值 $>$ $s2[i]$ 的 ASCII 值 → 返回正值($s1 > s2$) - 若所有字符相同但长度不同 → 较短字符串被视为更小[^4] 2. **函数行为** ```c int strcmp(const char *s1, const char *s2); ``` - 返回值 $<0$:$s1$ 字典序小于 $s2$ - 返回值 $=0$:两字符串相等 - 返回值 $>0$:$s1$ 字典序大于 $s2$[^3] #### ✅ 排序示例(冒泡排序) ```c #include <stdio.h> #include <string.h> int main() { char words[][20] = {"apple", "Banana", "cherry", "Date"}; int n = sizeof(words)/sizeof(words[0]); // 冒泡排序(字典序) for (int i = 0; i < n-1; i++) { for (int j = 0; j < n-1-i; j++) { if (strcmp(words[j], words[j+1]) > 0) { // 关键比较 char temp[20]; strcpy(temp, words[j]); strcpy(words[j], words[j+1]); strcpy(words[j+1], temp); } } } // 输出排序结果 for (int i = 0; i < n; i++) printf("%s\n", words[i]); } ``` 输出: ``` Banana // 注意:大写字母ASCII值小于小写字母 Date apple cherry ``` #### ⚠️ 注意事项 1. **区分大小写** 大写字母(如 `'A'=65`)ASCII 值小于小写字母(如 `'a'=97`),因此: ```c strcmp("Apple", "apple"); // 返回负值("Apple" < "apple") ``` 如需不区分大小写排序,需用 `strcasecmp()`(POSIX标准)或自定义比较函数[^4]。 2. **非ASCII字符** 对中文等非ASCII字符,需使用宽字符函数 `wcscmp()` 或本地化设置[^2]。 3. **效率考量** 在 $O(n^2)$ 排序算法中直接使用 `strcmp` 是安全的,但在 $O(n \log n)$ 算法(如快速排序)中,建议预先计算字符串长度以优化比较效率[^5]。 --- ### 总结 `strcmp` 是 C 语言中实现字典序排序的**标准工具**,其设计完全遵循字典序规则。实际使用时注意: 1. 直接用于排序算法的比较操作 2. 处理大小写敏感需求 3. 非ASCII字符需特殊处理[^2][^4]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值