目录
验证一个字符串是否是纯汉字或者包含有汉字的前提,是VS编辑器的默认编码格式设置为:选择 Unicode (UTF-8 带签名 - 代码页655001)。
一、使用的方法
1.使用正则表达式验证字符串
这种方法是有缺陷的(网上的很多例子都有这样的缺陷),是不完美的,是有限制的,换句话说,用正则表达式只能验证一个字符串是纯汉字的情况,当字符串是汉字、数字、字母、符号的无序混合体的时候,用正则表达式匹配字符串的返回值都是false,只有纯汉字的情况下返回值才是true。
// 用正则表达式验证字符串是否纯汉字
using System.Text.RegularExpressions;
namespace _088_1
{
class Program
{
static void Main(string[] args)
{
ArgumentNullException.ThrowIfNull(args);
string[] input = ["ss","ss达到","到达","到达ss", "ss达到ss"];
foreach(string inputItem in input)
{
if (ContainsChineseCharacter(inputItem))
{
Console.WriteLine("字符串是纯汉字。");
}
else
{
Console.WriteLine("无法判断是否包含汉字。");
}
}
}
/// <summary>
/// 使用正则表达式匹配纯汉字字符串
/// </summary>
static bool ContainsChineseCharacter(string input)
{
string pattern = @"^[\u4e00-\u9fa5]+$";
return Regex.IsMatch(input, pattern);
}
}
}
//运行结果:
/*
无法判断是否包含汉字。
无法判断是否包含汉字。
字符串是纯汉字。
无法判断是否包含汉字。
无法判断是否包含汉字。
*/
2.使用正则表达式验证字符
当然了,不是说用正则表达式的方法解决不了这个问题,而是执行方法的细节用错了。
根据1里面的描述和例子,用正则表达式判断一个字符(char)是否是汉字100%的灵验。那么,标题的设计目的就解决了:先把字符串转换成字符数组,然后对数组遍历根据正则表达式判断当前字符是否汉字,只要有一个字符是汉字,那么就返回字符串中包含有汉字。
适用的正则表达式可以是:^[\u4E00-\u9FA5]+$、^[\u4E00-\u9FA5]*$、^[\u4e00-\u9fa5]{0,}$、^[\u4e00-\u9fa5]{1,}$ ,其中, ^[\u4e00-\u9fa5]{0,}$ 要做字符串为空的判断。
3.用ASCII码判断
在 ASCII码表中,英文的范围是0-127,而汉字则是大于127。因此,可以通过遍历判断一个字符串中是否包含有汉