目录
题目:
以 GPT 技术为核心的人工智能系统出现后迅速引领了行业的变革,不仅用于大量的语言工作(如邮件编写或文章生成等工作),还被应用在一些较特殊的领域——例如去年就有同学尝试使用 ChatGPT 作弊并被当场逮捕(全校被取消成绩)。相信聪明的你一定不会犯一样的错误!
言归正传,对于 GPT 类的 AI,一个使用方式受到不少年轻用户的欢迎——将 AI 变成猫娘:
部分公司使用 AI 进行网络营销,网友同样乐于使用“变猫娘”的方式进行反击。注意:图中内容与题目无关,如无法看到图片不影响解题。
当然,由于训练数据里并不区分道德或伦理倾向,因此如果不加审查,AI 会生成大量的、不一定符合社会公序良俗的内容。尽管关于这个问题仍有争论,但至少在比赛中,我们还是期望 AI 能用于对人类更有帮助的方向上,少来一点猫娘。
因此你的工作是实现一个审查内容的代码,用于对 AI 生成的内容的初步审定。更具体地说,你会得到一段由大小写字母、数字、空格及 ASCII 码范围内的标点符号的文字,以及若干个违禁词以及警告阈值,你需要首先检查内容里有多少违禁词,如果少于阈值个,则简单地将违禁词替换为<censored>
;如果大于等于阈值个,则直接输出一段警告并输出有几个违禁词。
输入格式:
输入第一行是一个正整数 N (1≤N≤100),表示违禁词的数量。接下来的 N 行,每行一个长度不超过 10 的、只包含大小写字母、数字及 ASCII 码范围内的标点符号的单词,表示应当屏蔽的违禁词。
然后的一行是一个非负整数 k (0≤k≤100),表示违禁词的阈值。
最后是一行不超过 5000 个字符的字符串,表示需要检查的文字。
从左到右处理文本,违禁词则按照输入顺序依次处理;对于有重叠的情况,无论计数还是替换,查找完成后从违禁词末尾继续处理。
输出格式:
如果违禁词数量小于阈值,则输出替换后的文本;否则先输出一行一个数字,表示违禁词的数量,然后输出He Xie Ni Quan Jia!
。
输入样例1:
5
MaoNiang
SeQing
BaoLi
WeiGui
BuHeShi
4
BianCheng MaoNiang ba! WeiGui De Hua Ye Keyi Shuo! BuYao BaoLi NeiRong.
输出样例1:
BianCheng <censored> ba! <censored> De Hua Ye Keyi Shuo! BuYao <censored> NeiRong.
输入样例2:
5
MaoNiang
SeQing
BaoLi
WeiGui
BuHeShi
3
BianCheng MaoNiang ba! WeiGui De Hua Ye Keyi Shuo! BuYao BaoLi NeiRong.
输出样例2:
3
He Xie Ni Quan Jia!
输入样例3:
2
AA
BB
3
AAABBB
输出样例3:
<censored>A<censored>B
输入样例4:
2
AB
BB
3
AAABBB
输出样例4:
AA<censored><censored>
输入样例5:
2
BB
AB
3
AAABBB
输出样例5:
AAA<censored>B
代码长度限制16 KB,Java (javac)时间限制500 ms,内存限制256 MB,其他编译器时间限制400 ms,内存限制64 MB,栈限制8192 KB
代码:
C++(clang++)
无注释版:
#include<bits/stdc++.h>
using namespace std;
#define int long long
string s[110];
string t;
signed main(){
int n;
cin>>n;
getchar();
for(int i=0;i<n;i++){
getline(cin,s[i]);
}
int k;
cin>>k;
getchar();
getline(cin,t);
int cnt=0;
string ch="-";
for(int i=0;i<n;i++){
while(t.find(s[i])!=string::npos){
cnt++;
int f=t.find(s[i]);
t.erase(f,s[i].size());
t.insert(f,ch);
}
}
if(cnt>=k){
cout<<cnt<<"\n"<<"He Xie Ni Quan Jia!\n";
}
else{
while(t.find(ch)!=string::npos){
int f=t.find(ch);
t.erase(f,1);
t.insert(f,"<censored>");
}
cout<<t<<"\n";
}
}
有注释版:
#include<bits/stdc++.h> // 引入所有标准库,便于后续操作
using namespace std;
#define int long long // 定义int为long long类型,防止溢出(特别是处理较大数据时)
string s[110]; // 用于存储违禁词,最多支持100个违禁词
string t; // 用于存储待检查的文本
signed main() {
int n;
cin >> n; // 读取违禁词数量
getchar(); // 清除换行符(因为cin后面会有getline,需要先清除换行符)
// 读取所有违禁词
for(int i = 0; i < n; i++) {
getline(cin, s[i]); // 使用getline读取违禁词,支持包含空格的词语
}
int k;
cin >> k; // 读取阈值k
getchar(); // 清除换行符,准备读取待检查的文本
getline(cin, t); // 读取需要检查的文本
int cnt = 0; // 用于计数违禁词的数量
string ch = "-"; // 临时替代符,用来替换违禁词的位置,避免重复替换
// 遍历每个违禁词并进行查找和替换
for(int i = 0; i < n; i++) {
while(t.find(s[i]) != string::npos) { // 查找违禁词在文本中的位置
cnt++; // 每找到一个违禁词,计数器加1
int f = t.find(s[i]); // 获取违禁词的起始位置
t.erase(f, s[i].size()); // 删除违禁词
t.insert(f, ch); // 在找到的位置插入临时替代符
}
}
// 如果违禁词的数量大于等于阈值k,输出违禁词的数量和警告信息
if(cnt >= k) {
cout << cnt << "\n"; // 输出违禁词的数量
cout << "He Xie Ni Quan Jia!\n"; // 输出警告信息
} else {
// 否则将文本中的临时符号替换为<censored>
while(t.find(ch) != string::npos) {
int f = t.find(ch); // 找到临时符号的位置
t.erase(f, 1); // 删除临时符号
t.insert(f, "<censored>"); // 替换为<censored>
}
cout << t << "\n"; // 输出替换后的文本
}
return 0; // 程序正常结束
}