问题描述
URL 映射是诸如 Django、Ruby on Rails 等网页框架 (web frameworks) 的一个重要组件。对于从浏览器发来的 HTTP 请求,URL 映射模块会解析请求中的 URL 地址,并将其分派给相应的处理代码。现在,请你来实现一个简单的 URL 映射功能。
本题中 URL 映射功能的配置由若干条 URL 映射规则组成。当一个请求到达时,URL 映射功能会将请求中的 URL 地址按照配置的先后顺序逐一与这些规则进行匹配。当遇到第一条完全匹配的规则时,匹配成功,得到匹配的规则以及匹配的参数。若不能匹配任何一条规则,则匹配失败。
本题输入的 URL 地址是以斜杠 / 作为分隔符的路径,保证以斜杠开头。其他合法字符还包括大小写英文字母、阿拉伯数字、减号 -、下划线 _ 和小数点 .。例如,/person/123/ 是一个合法的 URL 地址,而 /person/123? 则不合法(存在不合法的字符问号 ?)。另外,英文字母区分大小写,因此 /case/ 和 /CAse/ 是不同的 URL 地址。
对于 URL 映射规则,同样是以斜杠开始。除了可以是正常的 URL 地址外,还可以包含参数,有以下 3 种:
字符串:用于匹配一段字符串,注意字符串里不能包含斜杠。例如,abcde0123。
整数 :用于匹配一个不带符号的整数,全部由阿拉伯数字组成。例如,01234。
路径 :用于匹配一段字符串,字符串可以包含斜杠。例如,abcd/0123/。
以上 3 种参数都必须匹配非空的字符串。简便起见,题目规定规则中 和 前面一定是斜杠,后面要么是斜杠,要么是规则的结束(也就是该参数是规则的最后一部分)。而 的前面一定是斜杠,后面一定是规则的结束。无论是 URL 地址还是规则,都不会出现连续的斜杠。
输入格式
输入第一行是两个正整数 n 和 m,分别表示 URL 映射的规则条数和待处理的 URL 地址个数,中间用一个空格字符分隔。
第 2 行至第 n+1 行按匹配的先后顺序描述 URL 映射规则的配置信息。第 i+1 行包含两个字符串 pi 和 ri,其中 pi 表示 URL 匹配的规则,ri 表示这条 URL 匹配的名字。两个字符串都非空,且不包含空格字符,两者中间用一个空格字符分隔。
第 n+2 行至第 n+m+1 行描述待处理的 URL 地址。第 n+1+i 行包含一个字符串 qi,表示待处理的 URL 地址,字符串中不包含空格字符。
输出格式
输入共 m 行,第 i 行表示 qi 的匹配结果。如果匹配成功,设匹配了规则 pj ,则输出对应的 rj。同时,如果规则中有参数,则在同一行内依次输出匹配后的参数。注意整数参数输出时要把前导零去掉。相邻两项之间用一个空格字符分隔。如果匹配失败,则输出 404。
样例输入
5 4
/articles/2003/ special_case_2003
/articles// year_archive
/articles//
/ month_archive
/articles//
/
/ article_detail
/static/ static_serve
/articles/2004/
/articles/1985/09/aloha/
/articles/hello/
/static/js/jquery.js
样例输出
year_archive 2004
article_detail 1985 9 aloha
404
static_serve js/jquery.js
样例说明
对于第 1 个地址 /articles/2004/,无法匹配第 1 条规则,可以匹配第 2 条规则,参数为 2004。
对于第 2 个地址 /articles/1985/09/aloha/,只能匹配第 4 条规则,参数依次为 1985、9(已经去掉前导零)和 aloha。
对于第 3 个地址 /articles/hello/,无法匹配任何一条规则。
对于第 4 个地址 /static/js/jquery.js,可以匹配最后一条规则,参数为 js/jquery.js。
数据规模和约定
1 ≤ n ≤ 100,1 ≤ m ≤ 100。
所有输入行的长度不超过 100 个字符(不包含换行符)。
保证输入的规则都是合法的。
时间限制: 1.0s
内存限制: 256.0MB
题目分析:
这道题文字描述比较多,一上来直接看头会比较大,不过仔细审题之后,我们可以慢慢整理出关键信息:
1. url规则是需要完全匹配
2. url中只可以包括数字、字母、减号、下划线以及小数点
3. 只有路径才会可以允许末尾/不一致,其他情况只要末尾/不一致就不匹配
4. 不能匹配空字符串
代码如下
#include<iostream>
#include<string>
#define print(A) cout << #A << ": "<< A << "|" << endl;
using namespace std;
const int maxn = 200;
int n, m;
string value[maxn], url1[maxn][maxn], url2[maxn][maxn];
bool isFlag1[maxn], isFlag2[maxn];
int url1Size[maxn], url2Size[maxn];
bool IsInt(string str) //判断是否为<int>
{
// cout<<"开始判断数字\n"<<str<<endl;
for(int i=0;i<str.length();i++)
if (!(str[i] <= '9' && str[i] >= '0'))
{
// cout<<"第"<<i<<"个字符不为数字 "<<str[i]<<endl;
return false;
}
return true;
}
string ToInt(string str) //去除<int>前边的0
{
// cout<<"开始转换数字\n";
string ans = "";
bool flag = true;
for(int i=0;i<str.length();i++)
{
if (str[i] != '0') flag = false;
if (!flag) ans += str[i];
}
// cout<<ans<<endl;
return ans;
}
bool IsStr(string str) //判断是否为<str>
{
for(int i=0;i<str.length();i++)
if (!((str[i] >= 'A' && str[i] <= 'Z') ||
(str[i] >= 'a' && str[i] <= 'z') ||
(str[i] >= '0' && str[i] <= '9') ||
str[i] == '-' ||
str[i] == '_' ||
str[i] == '.')) return false;
return true;
}
bool Equals(string str1, string str2) //这个函数没有用到,本来是打算判断两个字符串是否相等的,然后发现可以直接用==判断,之前担心的引用类型不能用==判断的情况没有出现,而且也可以用string.compare等多种方式来判断
{
// cout<<"开始比较 "<<str1<<'-'<<str2<<"-\n";
if (str1.length() != str2.length())
{
// cout<<"长度不等 "<<str1.length()<<' '<<str2.length()<<endl;
return false;
}
for(int i=0;i<=str1.length();i++)
{
if (str1[i] != str2[i])
{
// cout<<"第"<<i<<"个字符不匹配 "<<str1[i]<<' '<<str2[i]<<endl;
return false;
}
}
return true;
}
int getInfo(string str, string url[], bool flag) //根据读取出来的字符串解析出中间的元素,存入url数组,falg用来标记末尾是否有/,返回值是元素的个数
{
int l = -1;
for(int i=0;i<str.length();i++)
{
if (str[i] == '/')
{
l++;
}
else
{
url[l] += str[i];
}
}
if (flag) l--;
return l;
}
bool match(int i, int j, string &ans) //用来判断i地址和j规则是否匹配,匹配的话结果会存入ans中
{
ans = "";
if (url1[j][url1Size[j]] != "<path>")
{
if (url1Size[j] != url2Size[i]) return false; //提前判断末尾不为路径,元素个数不相等、末尾/不一致肯定不匹配
if (isFlag1[j] != isFlag2[i]) return false;
}
for(int k=0;k<=url1Size[j];k++) //对规则中特殊元素进行特殊处理
{
if (url1[j][k] == "<path>") //路径判断
{
if (k > url2Size[i]) return false; //防止path匹配空字符串
for(int k2=k;k2<=url2Size[i];k2++)
{
if (!IsStr(url2[i][k])) return false; //防止<str>不符合规则
ans += url2[i][k2]; //记录ans
if (!(!isFlag2[i] && k2 == url2Size[i]))
{
ans += "/"; //给每个元素之间添加/
}
}
}else if (url1[j][k] == "<str>") //字符串判断
{
if (!IsStr(url2[i][k])) return false;
ans = ans + url2[i][k] + ' '; //记录ans
}else if (url1[j][k] == "<int>") //数字判断
{
if (!IsInt(url2[i][k])) return false;
ans = ans + ToInt(url2[i][k]) + ' '; //记录ans
}else if (url1[j][k] != url2[i][k] || //普通元素完全匹配,并且给出的路径不违反规则
!IsStr(url2[i][k])) return false;
}
return true;
}
int main()
{
cin>>n>>m;
for(int i=0;i<n;i++)
{
string str1, str2;
cin>>str1>>value[i];
// print(str1);
// print(str1.length());
// print(value[i]);
// print(value[i].length());
// print(str1[str1.length()-1]);
isFlag1[i] = false;
if (str1[str1.length()-1] == '/') isFlag1[i] = true;
url1Size[i] = getInfo(str1, url1[i], isFlag1[i]);
// for(int j=0;j<=url1Size[i];j++) print(url1[i][j]);
}
for(int i=0;i<m;i++)
{
string str1, ans;
bool flag;
cin>>str1;
// print(str1);
// print(str1.length());
// print(str1[str1.length()-1]);
isFlag2[i] = false;
if (str1[str1.length()-1] == '/') isFlag2[i] = true;
url2Size[i] = getInfo(str1, url2[i], isFlag2[i]);
// for(int j=0;j<=url2Size[i];j++) print(url2[i][j]);
flag = true;
for(int j=0;j<n;j++)
{
if (match(i, j, ans))
{
cout<<value[j]<<' '<<ans;
flag = false; //匹配成功标记
break;
}
}
if (flag) cout<<"404"; //全未匹配,输出404
if (i != m-1) cout<<endl; //确认最后一行不转行
}
return 0;
}
Tips:
1. 题目说明是给出的url规则不违反路径规则,没有描述输入的路径不违反路径规则,所以要去判断
2. 注意空路径的判断。
总结:
这道题花费了我将近4个小时去a,一开始花了2个小时去处理字符串读入的一些处理问题,然后越写越乱,一气之下重头又写了一遍代码,把读入字符串的代码规整成一个函数,简明了代码,使后边我调bug的时候思路更清晰。
最后发现自己对string很不熟悉,字符串处理花费时间太长,需要整理归纳!!