提取html字符串中特定的文字内容

本文介绍了如何在JavaScript中从包含主标题和不定数量副标题的HTML字符串中,有效地提取不同标签内的文字内容,适用于处理带有<div class='subtitle-area'>结构的复杂字符串。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

由于业务需要,对于形如“主标题内容<div class='subtitle-area'><bold>副标题1</bold><p>副标题内容1</p></div>”

或者“主标题内容<div class='subtitle-area'><bold>副标题1</bold><p>副标题内容1</p><bold>副标题2</bold><p>副标题内容2</p></div>”

(即附副标题和副标题内容的个数不确定)的html字符串分别提取不同标签里面的内容。

<!DOCTYPE html>
<meta charset=utf-8>
<html>
<head>
	<title>提取html字符串中特定的文字内容</title>
</head>
<body>
</body>
<script type="text/javascript"> 
	var str1="主标题内容<div class='subtitle-area'><bold>副标题1</bold><p>副标题内容1</p></div>";
	var str2="主标题内容<div class='subtitle-area'><bold>副标题1</bold><p>副标题内容1</p><bold>副标题2</bold><p>副标题内容2</p></div>";
	var res=splitStr(str)
	console.log(str)
	console.log(res)	
	function splitStr(str){
		var result=[];
		var ps1=new Array();
		var ps2=new Array();
		var ps3=new Array();
		var ps4=new Array();		
		var index=0;
		searchSubStr(str,"<div class='subtitle-area'>",ps1);
		result[0]=str.substring(0,ps1[0]);
		index++;
		ps1=[];
		searchSubStr(str,"<bold>",ps1);
		searchSubStr(str,"</bold>",ps2)	;			
		searchSubStr(str,"<p>",ps3);
		searchSubStr(str,"</p>",ps4);
		
		for(var i=0; i<ps1.length;i++)
		{
			result[index++]=str.substring(ps1[i]+6,ps2[i]);
			result[index++]=str.substring(ps3[i]+3,ps4[i]);

		}
		return result;
	}
			
	function searchSubStr(str,subStr,ps){
		var pos = str.indexOf(subStr);
		while(pos>-1){
			ps.push(pos);
			pos = str.indexOf(subStr,pos+1);
		}

	}
 
</script>
</html>

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值