文本压缩有很多种方法,这里我们只考虑最简单的一种:把由相同字符组成的一个连续的片段用这个字符和片段中含有这个字符的个数来表示。例如 ccccc
就用 5c
来表示。如果字符没有重复,就原样输出。例如 aba
压缩后仍然是 aba
。
解压方法就是反过来,把形如 5c
这样的表示恢复为 ccccc
。
本题需要你根据压缩或解压的要求,对给定字符串进行处理。这里我们简单地假设原始字符串是完全由英文字母和空格组成的非空字符串。
输入格式:
输入第一行给出一个字符,如果是 C
就表示下面的字符串需要被压缩;如果是 D
就表示下面的字符串需要被解压。第二行给出需要被压缩或解压的不超过 1000 个字符的字符串,以回车结尾。题目保证字符重复个数在整型范围内,且输出文件不超过 1MB。
输出格式:
根据要求压缩或解压字符串,并在一行中输出结果。
输入样例 1:
C
TTTTThhiiiis isssss a tesssst CAaaa as
输出样例 1:
5T2h4is i5s a3 te4st CA3a as
输入样例 2:
D
5T2h4is i5s a3 te4st CA3a as10Z
输出样例 2:
TTTTThhiiiis isssss a tesssst CAaaa asZZZZZZZZZZ
注意:
对于压缩的过程,原本想将压缩的字符串存入到另外一个字符串数组中,最后统一输出,但是压缩过程中的字符串中包含的相邻重复字符可能不仅是个位数,可能出现极端情况(压缩的字符串含有9<n<=1000个单一字符),因此在存入新的字符数组中时,不能仅凭借count+'0'来记录个数,为了减少麻烦,直接输出
对于解压过程,可能同样出现压缩过程中的同样情形,字符串中可能会出现“123T...”,因此也不能仅通过count-'0'来统计个数,便自定义了一个多个字符转换为多位整数的函数int ascii_to_integer(string s,int *k)
更多其他类型的转换参见博客:https://blog.youkuaiyun.com/zjy900507/article/details/80608261
在压缩和解压过程中,都要注意下标的重定位
#include <iostream>
#include <stdio.h>
#include <string>
#include <stdlib.h>
#include <math.h>
using namespace std;
//将字符串中出现的多位数字转换为一个多位整数,
//并且将i的位置重新定位,定位至数字字符的下一位
int ascii_to_integer(string s,int *k)
{
int n = 0;
for (int i=*k;i<s.length();i++){
if(s[i] >= '0' && s[i] <= '9')//判断字符串中的数字字符
{
n = n*10 + (s[i]-'0');
(*k)++;
}
else
break;
}
//printf("k=%d\n",*k);
return n;
}
int main(){
int count,i,j;
char ch,zh;
string s;
ch = getchar();
getchar();
getline(cin,s);
if (ch=='C'){
for(i=0;i<s.length();i++){
count=1;
ch = s[i];
for(j=i+1;j<s.length();j++){
if (s[j]==ch)
count++;
else
break;
}
i=j-1;
//一定要在for循环之后重新将i定位;
//如果放在else里面则表示只有前后两个字符不同时,才将i定位,这时会忽略"TTTTTTT"这种极端情况
if(count>1){
printf("%d",count);
printf("%c",ch);
}else {
printf("%c",ch);
}
}
} else if(ch=='D'){
for (i=0;i<s.length();i++){
if(isdigit(s[i])){
count = ascii_to_integer(s,&i);
for (j=0;j<count;j++)
printf("%c",s[i]);
}
else
printf("%c",s[i]);
}
}
printf("\n");
return 0;
}