http://blog.youkuaiyun.com/pipisorry/article/details/43303145
Java字符串操作
两个字符串比较大小compareTo()
使用 String.compareTo 方法:
compareTo() 的返回值是int, 它是先比较对应字符的大小(ASCII码顺序)
1、如果字符串相等返回值0
2、如果第一个字符和参数的第一个字符不等,结束比较,返回他们之间的差值(ascii码值)(负值前字符串的值小于后字符串,正值前字符串大于后字符串)
3、如果第一个字符和参数的第一个字符相等,则以第二个字符和参数的第二个字符做比较,以此类推,直至比较的字符或被比较的字符有一方全比较完,这时就比较字符的长度.
String s1 = "abc";
String s2 = "abcd";
String s3 = "abcdfg";
String s4 = "1bcdfg";
String s5 = "cdfg";
System.out.println( s1.compareTo(s2) ); // -1 (前面相等,s1长度小1)
System.out.println( s1.compareTo(s3) ); // -3 (前面相等,s1长度小3)
System.out.println( s1.compareTo(s4) ); // 48 ("a"的ASCII码是97,"1"的的ASCII码是49,所以返回48)
System.out.println( s1.compareTo(s5) ); // -2 ("a"的ASCII码是97,"c"的ASCII码是99,所以返回-2)
字符串拼接
string拼接不要+,用join
方式1:
public static String join(CharSequence delimiter, CharSequence... elements)
此方法的第一个参数指定用于连接多个字符串的分隔符。注意,如果元素为null,则添加"null"。
String message = String.join("-", "This", "is", "a", "String");
// message returned is: "This-is-a-String"
方式2:
String a = 1+"d"+2;
其中也可以有int等等类型。
方式3:
str2.concat("c");
方式4:
StringBuilder stringBuilder = new StringBuilder("a");
stringBuilder.append("c");
String str3 = stringBuilder.toString();
当在频繁进行字符串的运算(如拼接、替换、删除等),或者在系统性能临界的时候,我们可以考虑使用concat或append方法。因为append方法最快、concat次之、加号最慢。
[Java 字符串拼接效率比较_添仔哥哥的博客-优快云博客]
字符串替换replaceAll
示例:JAVA 去除字符串首尾特定字符
String regex = "^" + splitter + "*|" + splitter + "*$";
return srcStr.replaceAll(regex, "");
字符串查找indexOf
1、int indexOf(String str) :返回第一次出现的指定子字符串在此字符串中的索引位置。
2、int indexOf(String str, int startIndex):从指定的索引位置开始,返回第一次出现指定子字符串在此字符串中的索引位置。
3、int lastIndexOf(String str) :返回此字符串中最后一次出现指定子字符串的索引位置。
4、int lastIndexOf(String str, int endIndex) :返回从索引位置0开始到指定位置,最后一次出现子串的索引位置。
java判断字符串包含某个字符段
1. 用indexOf()方法
String str = "1234567";
if(str.indexOf("23") != -1) {
System.out.println("包含该字符串"); }
public void test1() {
String string = "good morning everyone";
String sub = "morning";
int a = string.indexOf(sub);
if (a >= 0) {
System.out.println("morning在字符串中的位置:" + a);
String ss1 = string.substring(0, a + sub.length());
String ss2 = string.substring(a + sub.length(), string.length());
System.out.println("你需要的结果是:" + ss1);
System.out.println("删掉的字符是:" + ss2);
} else {
System.out.println("不存在");}}
2. 用repalce()方法
public class Test { public static void main(String[] args) { String s1 = "abc"; String s2 = "1111abcdefe"; if(s2.contains(s1)){ System.out.println("s2包含了s1"); //删掉s1 s2 = s2.replace(s2.substring(s2.indexOf(s1), s2.length()), ""); System.out.println(s2); }else{ System.out.println("s2不包含s1"); } } }
java判断一个字符串中是否包含某几个字符
1. string.matches(".*[【(个人)]*简\\s*[介历]*[】]*:*.*")
string.charAt(0) + "").matches("[,,]")
note:matches("[;;.::。]")中要有[],否则是匹配整个字符串
字符串分割split()
sourceStr.split(regex,maxSplit)
String[] sourceStrArray = sourceStr.split(",");
[java.lang.String 的 split() 方法]
字符串子串substring()
public String substring(int beginIndex, int endIndex)
第一个int为开始的索引,对应String数字中的开始位置,
第二个是截止的索引位置,对应String中的结束位置
1、取得的字符串长度为:endIndex - beginIndex;
2、从beginIndex开始取,到endIndex结束,从0开始数,其中不包括endIndex位置的字符
如:"hamburger".substring(4, 8) returns "urge"
取长度大于等于3的字符串a的后三个子字符串,只需a.subString(a.length()-3, a.length());
Java获取指定位置上字符charAt()
char c = string.charAt(int index);
字符串转换
String转List
String[] strs = {"aa","bb","cc"};
List<String> strsToList1= Arrays.asList(strs);
或者
List<String> strsToList2=new ArrayList<>();
Collections.addAll(strsToList2,strs);
str转list
范式
<T> List<T> result = Stream.of(str.split(",")).map(String::trim).map(convertFunction).collect(Collectors.toList());
其中
Function<String, T> convertFunction = Integer::valueOf; //long字符串转list
String::valueOf; //string字符串转list
字符串转set
Set<String> tmpItemSet = new HashSet<>(Arrays.asList(totalResi.split(",")));
hash:将字符串转成int数值
在Java中,整型数是32位的,也就是说最多有2^32= 4294967296个整数,将任意一个字符串,经过hashCode计算之后,得到的整数应该在这4294967296数之中。那么,最多有 4294967297个不同的字符串作hashCode之后,肯定有两个结果是一样的。
hash的string变化大时,直接.hashCode()可能冲突多。但是使用md5,又hash到128位了。所以两个结合。
Note: MD5是128位hash码(4个整数,每个整数4个字节)。我们假设它的计算结果是足够随机和足够分散的。因此,一个文件的MD5码,有2的128次方(用2e128表示,下面都用这种方式表示)个可能。进而 我们知道,随意找出来的两个文件的MD5码相等的可能性,是2e128分之一。
import java.math.BigInteger;
import java.security.MessageDigest;
import java.security.NoSuchAlgorithmException;
import java.util.Arrays;
import java.util.List;
import java.util.stream.Collectors;
public class HashUtils {
/**
* 将字符串转成数值
*/
public static int getUniqueInteger(String name) {
String plaintext = name;
int hash = name.hashCode(); // 点开可看内部实现
MessageDigest m;
try {
m = MessageDigest.getInstance("MD5");
m.reset();
m.update(plaintext.getBytes());
byte[] digest = m.digest();
BigInteger bigInt = new BigInteger(1, digest);
String hashtext = bigInt.toString(10);
// Now we need to zero pad it if you actually want the full 32 chars.
while (hashtext.length() < 32) {
hashtext = "0" + hashtext;
}
int temp = 0;
for (int i = 0; i < hashtext.length(); i++) {
char c = hashtext.charAt(i);
temp += (int) c;
}
return hash + temp;
} catch (NoSuchAlgorithmException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
return hash;
}
public static void main(String[] args) {
List<String> ss = Arrays.asList("夏天女装", "女装夏天", "老板,夏装", "ysl", "ysl \"限量版-口红");
for (String s : ss) {
System.out.println(s);
System.out.println(getUniqueInteger(s));
System.out.println(s.hashCode());
}
}
}
[Get unique integer value from string]
[hashcode的实现和原理https://www.cnblogs.com/javastack/p/14103260.html]
Java字符串其它处理
java判断字符串是否为double
try{
double b = Double.parseDouble(s);
}catch(Exception e){
//如果有异常 , s 字符串就不是一个double
}
Java正则表达式在字符串中插入字符
在字符串中日期1985[.07]-(- ——等等)1988[.12]前面插入句号,已经是 。 :;不插入,是. 等等替换
1. // 处理简历中的句号
String[] tmpResumeContents = resumeContent
.split("[((]*[\\d]{4}.[\\d]{2}[-——-]*[[\\d]{4}.[\\d]{2}]*");// 1985.07-1988.12
// for (String tmpResumeContent : tmpResumeContents)
// System.err.println("^^^^^^^^^" + tmpResumeContent);
StringBuffer original = new StringBuffer(resumeContent);
// System.err.println("^^^^^^^^^" + original);
for (String tmpResume : tmpResumeContents) {
// System.err.println("**************" + tmpResume
// +"tmpResume.length(): " + );
if (tmpResume.length() != 0
&& !(original.indexOf(tmpResume) + tmpResume.length() == original.length())
&& (!(original.toString().charAt(original.indexOf(tmpResume) + tmpResume.length() - 1) + "")
.matches("[。:;]")))
if ((original.toString().charAt(original.indexOf(tmpResume) + tmpResume.length() - 1) + "")
.matches("[.,,]")) {
// System.err.println("^^^^^^^^^"+(original.toString().charAt(original.indexOf(tmpResume)+
// tmpResume.length() - 1)));
original.replace(original.indexOf(tmpResume) + tmpResume.length() - 1,
original.indexOf(tmpResume) + tmpResume.length(), "。");
} else {
int insertPoint = 0;
do {
// System.err.println("^^^^^^^^^" +
// original);
// System.err.println("***" + tmpResume);
// System.out.println("***" + insertPoint);
insertPoint = original.indexOf(tmpResume, insertPoint) + tmpResume.length();
// System.out.println("&&&" + insertPoint +
// "&&&" +
// original.toString().charAt(insertPoint));
} while ((insertPoint < original.length())
&& !(("" + original.toString().charAt(insertPoint)).matches("[\\s]*[\\d((]*")));
// System.err.print("***" + tmpResume);
// System.err.print("&&&" + insertPoint + "&&&"
// + original.toString().charAt(insertPoint)
// + "\n");
original.insert(insertPoint, "。");
}
}
resumeContent = original.toString();// 因为resumeContent.indexOf要时时更新
resumeContent = endWithDot(resumeContent);
// System.err.println("***************" + resumeContent);
2. lastIndexOf(String str):反向索引 解决可能两次匹配情况
do_while循环解决多次匹配情况
3. 取出日期来匹配,不用日期spilt后的字符串匹配,就没有多次匹配出现了
Java中文转码解码
爬虫中文乱码处理
package Test;
import java.io.UnsupportedEncodingException;
import java.net.URLDecoder;
import java.net.URLEncoder;
public class EncodeConvert {
public static void main(String[] args) {
System.out.println(getencode("赵景山"));
System.out.println(getDecode("%D5%D4%BE%B0%C9%BD"));
}
// 中文转码
public static String getencode(String str) {
String encodeStr = null;
try {
// 编码类型为gbk
encodeStr = URLEncoder.encode(str, "gbk");
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}
return encodeStr;
}
// 解码
public static String getDecode(String str) {
String decodeStr = null;
try {
// 编码类型为gbk
decodeStr = URLDecoder.decode(str, "gbk");
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}
return decodeStr;
}
}
from:Java字符串操作及处理_皮皮blog-优快云博客
ref:java中String的七种用法