LeetCode 1410. HTML 实体解析器
描述
「HTML 实体解析器」 是一种特殊的解析器,它将 HTML 代码作为输入,并用字符本身替换掉所有这些特殊的字符实体。
HTML 里这些特殊字符和它们对应的字符实体包括:
- 双引号:字符实体为 " ,对应的字符是 " 。
- 单引号:字符实体为 ’ ,对应的字符是 ’ 。
- 与符号:字符实体为 & ,对应对的字符是 & 。
- 大于号:字符实体为 > ,对应的字符是 > 。
- 小于号:字符实体为 < ,对应的字符是 < 。
- 斜线号:字符实体为 ⁄ ,对应的字符是 / 。
给你输入字符串 text ,请你实现一个 HTML 实体解析器,返回解析器解析后的结果。
示例 1:
输入:text = “& is an HTML entity but &ambassador; is not.”
输出:“& is an HTML entity but &ambassador; is not.”
解释:解析器把字符实体 & 用 & 替换
提示:
1 <= text.length <= 10^5
字符串可能包含 256 个ASCII 字符中的任意字符。
题解
- 方法1
class Solution {
public String entityParser(String text) {
// 哈希存储 替换的字符串
HashMap <String,String> map = new HashMap<>(){
{
put(""","\"");
put("'","'");
put("&","&");
put(">",">");
put("<","<");
put("⁄","/");
}
};
// 长度
int n = text.length();
// 存储结果
StringBuilder sb = new StringBuilder();
// 进行替换
for(int i = 0;i<n;){
// 找到 &
if( text.charAt(i) == '&' ){
int j = i+1;
while( j<n && j-i<6 && text.charAt(j) != ';' ){
j++;
}
String str1 = text.substring( i,Math.min(j+1,n) );
// 判断是否需要替换
if( map.containsKey(str1) ){
sb.append( map.get(str1) );
i = j+1;
continue;
}
}
sb.append(text.charAt(i++));
}
// 返回结果
return sb.toString();
}
}
- 方法2
class Solution {
public String entityParser(String text) {
String s = text.replaceAll(""", "\"");
String s1 = s.replaceAll("'", "\'");
String s2 = s1.replaceAll(">", ">");
String s3 = s2.replaceAll("<", "<");
String s4 = s3.replaceAll("⁄", "/");
String s5 = s4.replaceAll("&", "&");
return s5;
}
}