java 判断每个字符串中指定字符的个数

最新推荐文章于 2024-08-14 04:41:09 发布

原创最新推荐文章于 2024-08-14 04:41:09 发布 · 5k 阅读

8 ·

CC 4.0 BY-SA版权

文章标签：

#java

该博客探讨了Java中String类的split()方法，通过示例代码展示了如何利用该函数将字符串按特定分隔符拆分成数组，并获取到包含分隔符的子串数量。内容涉及字符串处理的基本操作和数组长度的计算。

利用 String 的 split() 函数

示例

String str = "abcd#abcd#abcd#abcd#";
String[] split = str.split("#");
int len = split.length - 1;

这个 len 值就是包含的指定字符个数的值

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

kmswilliam

关注关注

3
点赞
踩
8

收藏

觉得还不错? 一键收藏
2
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

获取一个字符串中各个字符的个数

qq_56001285的博客

08-11

2922

先将字符串转化成字符数组，然后进行遍历，因为我们需要确定各个字符的个数，因此使用到了Map集合，因为Map集合中键是无法重复的，因此我们将字符看成为键，将个数看成为值，然后判断Map集合中是否存在该字符的键，如果存在，那么就在值的后面加一即可，如果不存在哪么新建一个键后面填上个数1 import java.util.HashMap; import java.util.Map; import java.util.Set; public class XinJiHe { /** * 定.

java 找到字符串某个字符的个数

weixin_30258621的博客

08-14

871

如何用Java找到字符串中某个字符的个数在Java编程中，处理字符串是一项常见的任务。有时候，我们需要找出一个字符串中某个特定字符出现的次数。这篇文章将帮助你完成这个任务。我们将通过一个系统的流程来实现这一功能，并且我会逐步带你了解实现的每一步。项目整体流程我们将通过以下几个步骤来实现这一功能：步骤说明 ...

2 条评论您还未登录，请先登录后发表或查看评论

Java统计字符串中特定字符的个数。

“种一棵树最好的时间是十年前，其次就是现在。”

05-11

1118

今天再刷力扣的时候，需要写一个方法统计字符串中特定字符的个数。一般最基本的想法肯定就是无脑for循环嘛，我就是这样的写的，然后在看题解的时候发现了一个不错的思路，用字符串长度来表示个数，与大家分享一下。

java查找字符串中指定字符个数

xiejunna的博客

04-27

6162

/** * 查询字符串中指定字符个数 * @param oriStr 原字符串 * @param findStr 需要查找的字符 * @param count 固定值：0 * @return 查找到字符的个数 */ public static int findStrCount(String oriStr, String findStr, int count) { if (oriStr.contains(findStr)) { count++; count = fi

Java编程实现查找字符串中想要找的字符个数

2301_80647986的博客

11-21

258

System.out.println("找到的次数为 = " + counter);System.out.print("请输入第一串字符：");System.out.print("请输入第二串字符：");

java获取string中的某个字符数量

weixin_30258621的博客

08-14

657

Java获取字符串中某个字符数量的指南在Java编程中，字符串的处理是非常常见的任务之一。特别是，很多开发者希望能够计算字符串中某个特定字符出现的次数。本文将为您详细介绍如何使用Java来实现这一功能，并提供相应的代码示例。 字符串和字符在Java中，字符串是一系列字符的集合，可以通过String类来表示。我们通常需要...

JAVA 统计字符串中中文,英文,数字,空格,特殊字符的个数

08-25

JAVA 统计字符串中中文、英文、数字、空格、特殊字符的个数在日常的编程工作中，我们经常需要统计字符串中不同类型的字符个数，例如中文、英文、数字、空格、特殊字符等。在 Java 中，我们可以使用 Unicode 编码来...

java统计文件中每个字符出现的个数

08-26

Java 统计文件中每个字符出现的个数 Java 是一种广泛应用于软件开发的编程语言，而统计文件中每个字符出现的个数是 Java 编程中的一种常见操作。本文将详细介绍 Java 统计文件中每个字符出现的个数的方法，并提供了...

java8 统计字符串字母个数的几种方法总结(推荐)

08-28

使用 Collections.frequency 可以实现字母个数的统计，通过将字符串变成集合，循环比较每个字串来获取出现次数。 ```java public static void letterCount3(String s) { s = s.replaceAll(" +", ""); List...

java中判断字段真实长度的实例(中文2个字符,英文1个字符)

08-31

Java中判断字段真实长度的实例是针对如何在编程时考虑到中英文字符在长度上的差异，并且给出一个能够在字符串处理时反映出这种差异的实用方法。这个实例中提到的是，中文字符占用的空间为两个英文字符的空间。这个...

java实现统计字符串中字符及子字符串个数的方法示例

08-31

通过遍历字符串的每个字符，利用`Character.isDigit()`、`Character.isLowerCase()`和`Character.isUpperCase()`方法来判断字符的类型，并相应地增加计数器的值。 ```java for (int i = 0; i (); i++) { char ch =...

Java获取字符串单词个数

huangbaokang的博客

03-26

1245

public static int getWordCount(String content){ int count = 0; String cn_words = content.replaceAll("[^(\\u4e00-\\u9fa5，。《》？；’‘：“”【】、）（……￥！·)]", ""); int cn_words_count = cn_w...

Java 判断字符串中指定字符的个数（修正版）

Aaron_Yang

02-07

1万+

之前在网上找了一些帖子，发现是错的，用起来有问题，特此更正来自己写的，方便今后查询。原方法 String str = "abcd#abcd#abcd#abcd#"; String[] split = str.split("#"); int len = split.length - 1; 后来发现，用split方法的话，length中途会出现负数我的方法（建议使用） int cnt = 0; String str = "25624581153256"; if(str.contains("2"))

Java_统计字符串出现的个数

weixin_45017098的博客

04-29

2842

【代码】Java_统计字符串出现的个数。

java中判断字符串存在几个给定的字符

weixin_41283094的博客

07-30

353

字符串匹配个数

haojiefenglang的博客

04-19

1900

程序功能说明：在输入的字符串中，找到指定字符串“virus”在该字符串中包含子串所有可能性个数。例如：输入：virusttviruse，输出结果：23。 #include<stdio.h> #include<string.h> long f(int n); //查询匹配的个数 int find(char *arr, char *temp, int len_a, in...

Java实现获取指定字符串中某个子字符串出现的个数

名字正在想呢的博客

04-17

2万+

public class findStrNum { public static void main(String[] args) { String str = "a abc fo abc gsdfsdsbcsgsod abcsgs abc"; int fromIndex = 0; int count = 0; while...

java统计一个字符串中某个字符串出现的个数

最新发布

07-07

<think>我们有一个需求：在Java中判断字符串中包含的汉字数量。根据引用资料，我们可以总结几种方法：方法1（引用[2]和[3]）：逐个字符判断，利用中文字符在UTF-8编码下占多个字节（通常2-4个字节，但一个字符在Java内部是UTF-16编码，所以这里的方法并不准确，因为String.getBytes("UTF-8")可以获取字节数，但一个中文字符在UTF-8中通常占3个字节，而英文字符占1个字节。所以如果某个字符的UTF-8字节数大于1，则可以认为是中文字符（但注意，其他非中文字符也可能占多个字节，比如日文、韩文等，所以这个方法实际上是判断非ASCII字符，包括中文）。方法2（引用[4]）：将字符转换成二进制字符串，如果长度大于8，则说明是双字节字符（这里应该是针对Java的char类型，因为Java的char是16位，所以英文字符也是16位，但通常英文字符的Unicode码点小于128，其二进制表示可能不足16位，但转换为二进制字符串时，Integer.toBinaryString()会去掉前导零，所以英文字符的二进制字符串长度一般小于等于8，而中文字符的码点大于255，所以二进制字符串长度会大于8？）。但是，注意：Java的char是16位，所以一个char的二进制表示最多16位，所以大于8位并不代表就是中文字符，因为英文字符的Unicode码点也在0-127之间，二进制位数小于8（实际上7位就够了），但转换为二进制字符串时，如果高位有0，会被省略。所以如果一个字符的二进制字符串长度大于8，那么它至少需要9位以上，即码点值大于255（2^8-1=255），所以可以认为是非拉丁字符，包括中文。但是，更准确的方法是使用正则表达式或者Unicode范围来判断。因为汉字在Unicode中有一个范围：通常是[\u4e00-\u9fa5]（这个范围覆盖了大部分常用汉字，但还有一些扩展汉字不在这个范围内，比如𠀀（扩展A）等，如果需要更全面，可以包括扩展区）。因此，我们可以采用以下方法：方法3：使用正则表达式匹配每个字符是否在汉字的Unicode范围内。我们选择方法3作为更准确的方法，同时也可以使用方法1或方法2作为参考，但方法1可能误判其他非中文字符，方法2实际上也是通过码点值判断（大于255的为非拉丁字符，但不一定是中文）。具体步骤： 1. 遍历字符串中的每个字符。 2. 判断字符是否在汉字的Unicode范围内（例如：\u4e00-\u9fa5，或者还包括扩展区，比如\u3400-\u4DBF（扩展A）等，根据需求选择范围）。 3. 统计满足条件的字符个数。但是，由于汉字Unicode范围有多个，我们这里使用常用范围[\u4E00-\u9FA5]，以及全角中文标点等可能不包括在内，如果需求是只统计汉字（不包括标点），那么这个范围就够了。如果还需要包括中文标点，则需要另外添加范围。根据需求，我们只统计汉字（即中文字符中的汉字部分），所以使用[\u4E00-\u9FA5]即可。代码示例：我们可以写一个方法，输入一个字符串，返回其中汉字的个数。注意：Java中可以使用Character.UnicodeBlock来判断，但这里我们直接使用字符的Unicode码点范围。实现： ```java public class ChineseCharacterCounter { public static void main(String[] args) { String str = "Hello, 你好！这是一段测试文本。"; int count = countChineseCharacters(str); System.out.println("字符串中汉字的个数为: " + count); } public static int countChineseCharacters(String str) { if (str == null || str.isEmpty()) { return 0; } int count = 0; for (char c : str.toCharArray()) { // 判断字符c是否在汉字的Unicode范围内（常用汉字范围：4E00-9FA5） if (c >= '\u4e00' && c <= '\u9fa5') { count++; } } return count; } } ``` 但是，上面的方法只考虑了常用汉字，如果字符串中包含生僻字（比如扩展A区的汉字），则不会被统计。如果需要更全面的统计，可以扩展范围，例如： - 扩展A区：\u3400-\u4DBF - 常用汉字：\u4E00-\u9FFF（这里比9FA5大一些，包括了9FA5之后的少量汉字） - 扩展B区：\u20000-\u2A6DF（注意：这些字符在Java中是用两个char表示的，即代理对（surrogate pair））因此，如果字符串中可能包含扩展B区及之后的汉字（即Unicode码点大于0xFFFF的字符），那么我们需要使用码点（code point）来遍历字符串，而不是使用char（因为char只能表示0~FFFF的字符）。修改后的方法（支持辅助平面字符）： ```java public static int countChineseCharacters(String str) { if (str == null || str.isEmpty()) { return 0; } int count = 0; // 使用码点遍历 for (int i = 0; i < str.length(); ) { int codePoint = str.codePointAt(i); // 判断该码点是否在汉字范围内 if (isChineseCodePoint(codePoint)) { count++; } // 根据码点所占的字符长度移动索引 i += Character.charCount(codePoint); } return count; } private static boolean isChineseCodePoint(int codePoint) { // 常用汉字范围（4E00-9FFF） if (codePoint >= 0x4E00 && codePoint <= 0x9FFF) { return true; } // 扩展A区（3400-4DBF） if (codePoint >= 0x3400 && codePoint <= 0x4DBF) { return true; } // 扩展B区（20000-2A6DF） if (codePoint >= 0x20000 && codePoint <= 0x2A6DF) { return true; } // 扩展C区（2A700–2B73F）和扩展D区（2B740–2B81F）等，根据需要添加 // 这里只列了部分，实际可以根据需求扩展 return false; } ``` 注意：上面的扩展区范围很大，实际应用中根据需求选择。如果只需要常用汉字，使用第一个范围即可。另外，引用[2]中提供了一个方法：通过UTF-8编码的字节数判断，但这种方法会误判其他非中文字符（比如日文、韩文等），如果需求是只统计中文，那么这种方法不准确。引用[4]的方法：将字符转换为二进制字符串，判断长度是否大于8。实际上，它判断的是字符的Unicode码点是否大于255（因为一个字节8位，大于255的字符需要超过8位来表示）。但这种方法同样会把非中文的其他非ASCII字符（如日文、希腊字母等）统计进来。因此，我们推荐使用Unicode范围的方法，准确统计汉字。相关问题： 1. 如何判断一个字符是否是中文汉字（包括生僻字）？ 2. 在Java中，如何处理包含代理对的字符串（即辅助平面字符）？ 3. 除了汉字，如何统计字符串中中文字符（包括标点符号）的数量？ 4. 如何优化统计大量文本中汉字数量的性能？</think>### Java 判断字符串中汉字个数的实现方法在 Java 中判断字符串包含的汉字数量，可以通过以下几种方法实现： #### 方法 1：Unicode 范围判断（推荐） ```java public static int countChineseCharacters(String str) { if (str == null || str.isEmpty()) return 0; int count = 0; for (char c : str.toCharArray()) { // 汉字 Unicode 范围：\u4E00-\u9FA5（基本汉字）和 \uF900-\uFAFF（扩展汉字） if ((c >= '\u4E00' && c <= '\u9FA5') || (c >= '\uF900' && c <= '\uFAFF')) { count++; } } return count; } ``` **原理**：汉字在 Unicode 中分布在特定区间（4E00-9FA5 和 F900-FAFF），直接检查字符是否落在此区间即可[^3]。 #### 方法 2：字节长度差异法 ```java public static int countChineseByBytes(String str) { if (str == null) return 0; int count = 0; try { for (char c : str.toCharArray()) { // UTF-8 编码下汉字占 3 字节，ASCII 占 1 字节 if (String.valueOf(c).getBytes("UTF-8").length > 1) { count++; } } } catch (UnsupportedEncodingException e) { e.printStackTrace(); } return count; } ``` **注意**：此方法会误判其他非 ASCII 字符（如日文、韩文）[^2]。 #### 方法 3：正则表达式匹配 ```java public static int countChineseByRegex(String str) { if (str == null) return 0; // 匹配所有汉字（Unicode 范围） String regex = "[\\u4E00-\\u9FA5\\uF900-\\uFAFF]"; Pattern pattern = Pattern.compile(regex); Matcher matcher = pattern.matcher(str); int count = 0; while (matcher.find()) { count++; } return count; } ``` ### 使用示例 ```java public static void main(String[] args) { String text = "Hello, 世界！Java编程 2024"; System.out.println("Unicode 方法: " + countChineseCharacters(text)); // 输出 4 System.out.println("字节长度方法: " + countChineseByBytes(text)); // 输出 4 System.out.println("正则表达式方法: " + countChineseByRegex(text)); // 输出 4 } ``` ### 注意事项 1. **扩展汉字支持**：如需包含生僻字（如𠀀），需扩展 Unicode 范围（如 `\u3400-\u4DBF` 扩展 A 区）[^3]。 2. **代理对处理**：对于 Unicode 辅助平面字符（如𩸽），需使用 `codePointAt()` 而非 `charAt()`。 3. **性能建议**： Unicode 范围判断性能最优，正则表达式适合复杂匹配但效率较低[^4]。 > 示例输出：字符串 `"Hello, 世界！Java编程 2024"` 包含 4 个汉字（"世"、"界"、"编"、"程"）。