#include "stdio.h"
#include "stdlib.h"
#include "string.h"
#include "iostream"
using namespace std;
char prog[10000]; //存储字符
char token[200];
char ch='a';
int syn,p,m,n,sum; //种别码,p定位prog变量,m定位token变量,
char *rwtab[15]={"main","begin","if","then","while","end","int","for","float","char","else","break","return","do","case"};
void scaner()
{
// 前三行是初始化数据,初始化字符数组token ,元素全都是 null
for(n=0;n<8;n++) token[n]=NULL; //将token设置为空
// 先读取值,再p++,也就是从下标0开始读取
m=0;
ch=prog[p++];
//printf("\n%c\n", ch);
//printf("\n%d\n", p);
while(ch==' ') ch=prog[p++]; //滤过空格,在此处滤掉的空格指单词前面的,后面不会过滤掉
// 运用 ASCLL码,对字母范围确定,下面判断数字同理
// 判断关键字和标识符(关键字与标识符,_开头)
if((ch >= 'a' && ch <= 'z')||(ch >= 'A' && ch <= 'Z'))
{
// 当读取到字母开头是, 就开始进入循环了,取得以该字符开头的 关键字(或者是标识符)
while ((ch >= 'a' && ch <= 'z')||(ch >= 'A'&& ch <= 'Z')||(ch >= '0' && ch <= '9'))
{
token[m++]=ch; //输入字符入字符串
ch=prog[p++]; //在输入字符
//printf("\nm\n");
}
token[m++]='\0'; // 字符数组结尾符号
/*回退一个字符; 此时的p代表 非字母或数字的字符的 下一个字符*/
p--; // 回退到 非字母或数字的那个字符
// 先预先设置为 标识符的 种别码
syn=4;
for(n=0; n<14; n++)
if(strcmp(token,rwtab[n])==0) // 判等函数,相等返回0, 大于返回正整数,小于返回负整数
{
// 进入if里说明相等是关键字,给syn 赋值标识符的种别码
syn = 1;
break;
}
}
else if(ch >= '0' && ch <= '9') // 用来判断数字
{
sum = 0; // 老师的代码忘记了初始化sum这一步, 并且绝对不能放到while循环内部初始化
while(ch >= '0' && ch<= '9')
{
sum = sum * 10 + ch -'0'; // 也是利用ASCLL码,将字符转化为数字,然后实现累加,计算数值(巧妙) 45 sum=0+84-80=4 sum=40+85-80=45
ch=prog[p++];
}
p--; // 同样p--,因为这个p--代表的字符,还没被处理
syn=5;
}
else //判断运算符
switch(ch)
{
case'<': token[m++]=ch;
// 下面这些是用来判断是否有 <= 或者 <>的
ch = prog[p++];
if(ch=='>') {syn=3; token[m++]=ch;}
else if(ch=='=') {syn=2; token[m++]=ch;}
else {syn=2; p--;}
break;
case'>': token[m++]=ch;
ch=prog[p++];
// 同上,不过老师的 syn 值给错了,改过来就行
if(ch=='=') { syn=2; token[m++]=ch;}
else { syn=2; p--;}
break;
case'+': syn=2; token[0]=ch;break;
case'-': syn=2; token[0]=ch;break;
case'*': syn=2; token[0]=ch;break;
case'/': syn=2; token[0]=ch;break;
case'%': syn=2; token[0]=ch;break;
/*...补齐单词表中其他单个界符;*/
case'=': syn=2; token[0]=ch;break;
case';': syn=3; token[0]=ch;break;
case'(': syn=3; token[0]=ch;break;
case')': syn=3; token[0]=ch;break;
case'$': syn=0; token[0]=ch;break;
case'{': syn=3; token[0]=ch;break;
case'}': syn=3; token[0]=ch;break;
case'"': syn=3; token[0]=ch;break;
case',': syn=3; token[0]=ch;break;
default:syn=-1;
}
}
void filter(char r[],int pProject) //滤掉无意义字符,r由prog传参,pProject为字符串长度
{
char tempstr[10000]; //中间变量
int count = 0; //tempstr的下表变量
for(int i = 0;i<=pProject;i++)
{
//单行注释,直到遇到回车换行
if(r[i]=='/'&&r[i+1]=='/') //单行注释以‘//’开头
{
while(r[i]!='\n') //单行注释下行结束
{
i++;
}
}
//多行注释
if(r[i]=='/'&&r[i+1]=='*') //多行注释以‘/*'开头
{
i+=2; //滤过'/*’
while(r[i]!='*' || r[i+1]!='/')
{
i++;
if(r[i]=='$') //在注释中间遇到了结束符号
{
printf("Error! Please press any key to indicate that you know :");
getchar();
exit(0);
}
}
i += 2; //滤过'*/’
}
if (r[i] != '\n'&&r[i] != '\t'&&r[i] != '\v'&&r[i] != '\r')
{//若出现无用字符,则过滤;否则加载
tempstr[count++] = r[i]; //count++先用后+,把没有过滤的可用字符加至tempstr数组中
}
}
tempstr[count] = '\0'; //结尾加一个字符串结束符号
strcpy(r, tempstr); //将tempstr赋值到r中
}
int main()
{
int pProject = 0; //定义标识变量
FILE *fp,*fp1; //定义文件
if((fp = fopen("D:\\fxq\\fxq\\data.txt","r")) == NULL)
{
cout<<"can't open this file"<<endl;
exit(0);
}
prog[pProject] = fgetc(fp); //获取首字符
while(prog[pProject] != '$')
{
pProject++;
prog[pProject]=fgetc(fp); //获取全部字符
}
pProject++;
prog[pProject] = '\0'; //加入字符串结束标记字符
fclose(fp); //关闭fp文件
cout<<"原文件输出如下:"<<endl;
cout<<prog<<endl; //输出一下全部字符
cout<<"过滤注释回车等字符后输出如下:"<<endl;
filter(prog,pProject); //滤掉注释
cout<<prog<<endl; //输出滤掉注释后代码
p=0; //初始化prog下标
do
{
scaner();
// 执行完函数后,全局变量 syn, token的值就会自动改变。
switch(syn)
{
// 11数字 二元组
case 5:printf("\n(%d, %d)",syn,sum);
break;
// 不符合语法的字符,报错
case -1:printf("\nerror"); break;
// 输出关键字,或者是 标识符
default:printf("\n(%d, %s)", syn, token);
}
}while(syn != 0); // 遇$ 为0,结束循环。
system("pause");
return 0;
}
11111
最新推荐文章于 2023-11-20 02:03:52 发布