小说提取器规则

//规则更新日期20241015
/*****
	{
		网站网址 = "https://www.haobiquge.net";
		目录提取正则 = `\<dd>\<a href="(.+?)">(.+?)\</a>\</dd>`;
		文章网址前缀 = "https://www.haobiquge.net";
		文章正文换行符号正则 = {"@<p>","@<br>","@<br />"};//字符串或数组
		文章正文div的id = "content";
		文章正文段前空格文本 = "  ";
		文章内容忽略文本正则 = {"@</p>","@nbsp;"}; //字符串或数组
		下一页网址提取正则 = `\<a id="A3" href="(\S+?)" target="_top" class="next">下一[页|章]\</a>`;
		下一页网址前缀 = "https://www.haobiquge.net";
		正文标题提取正则 = `\<div class="bookname">\s*?\<h1>(.+?)\</h1>`;
	},
	{
		网站网址="https://www.qu70.cc/";
		目录提取正则 = `\<dd>\<a href ="(.+?)">(.+?)\</a>\</dd>`;
		文章网址前缀 = "https://www.qu70.cc/";
		文章正文换行符号正则 = {"@<p>","@<br>","@<br />"};//字符串或数组
		文章正文div的id = "chaptercontent";
		文章正文段前空格文本 = "  ";
		文章内容忽略文本正则 = {"@请收藏本站:https://www.qu70.cc。", //字符串或数组
							"@笔趣阁手机版:https://m.qu70.cc",
							"@『点此报错』",
							"@『加入书签』"
							};
		下一页网址提取正则 = `\<a href="(\S+?)" id="pb_next" class="Readpage_down js_page_down">下一[页|章]\</a>`;
		下一页网址前缀 = "https://www.qu70.cc";
		正文标题提取正则 = `\<div class="content">\s+?\<h1 class="wap_none">(.+?)\</h1>`;
	},
	{
		网站网址 = "https://www.ybsf.org";
		目录提取正则 = `\<dd>\<a href="(.+?)">(.+?)\</a>\</dd>`;
		文章网址前缀 = "https:";
		文章正文div的id = "content";
		文章正文换行符号正则 = {"@<p>","@<br>","@<br />"};//字符串或数组
		文章正文段前空格文本 = "  ";
		文章内容忽略文本正则 = {}; //字符串或数组
		下一页网址提取正则 = `\<a href="(\S+?)">下一章\</a>`;
		下一页网址前缀 = "https:";
		正文标题提取正则 = `\<a name="top">\</a>\s+?\<h1>(.+?)\</h1>`;			
	},
	{
		网站网址 = "https://www.disanzww.com";
		目录提取正则 = `\<li>\<a style="color\:Gray;" href="(.+?)">(.+?)\</a>\</li>`;
		文章网址前缀 = "https://www.disanzww.com";
		文章多页网址替换文本 = {".html","_2.html"};		
		文章正文换行符号正则 = {"@<p>","@<br>","@<br />"};//字符串或数组
		文章正文div的id = "content";
		文章正文段前空格文本 = "  ";
		文章内容忽略文本正则 = {"@</p>"}; //字符串或数组
		下一页网址提取正则 = `\<a id="next_url" href="(\S+?)">`;
		下一页网址前缀 = "https://www.disanzww.com";
		正文标题提取正则 = `\<h1 class="title">(.+?)\</h1>`;
	},
	{
		网站网址 = "https://m.baode.cc";
		目录提取正则 = `\<li>\<a href="(.+?)" title="(.+?)" `;
		文章网址前缀 = "https:";
		文章多页网址替换文本 = {".html","_2.html"};
		文章正文换行符号正则 = {"@<p>","@<br>","@<br />"};//字符串或数组
		文章正文div的id = "nr";
		文章正文段前空格文本 = "  ";
		文章内容忽略文本正则 = {"@</p>"}; //字符串或数组
		下一页网址提取正则 = `\<a class="dise" href="(\S+?)">下一[章|页]\</a>`;
		下一页网址前缀 = "https:";
		正文标题提取正则 = `\<div class="zhong">(.+?)\</div>`;		
	},
	{
		网站网址 = "https://www.skjvvx.cc";
		目录提取正则 = `\<dd>\<a href ="(.+?)">(.+?)\</a>\</dd>`;
		文章网址前缀 = "https://www.skjvvx.cc";
		文章多页网址替换文本 = {".html"};
		文章正文换行符号正则 = {"@<p>","@<br>","@<br />"};//字符串或数组
		文章正文div的id = "content";
		文章正文段前空格文本 = "  ";
		文章内容忽略文本正则 = {"@app2();", //字符串或数组
							"\(https\://www\.skjvvx\.cc/a/15/15225/\d+?\.html\)",
							"@chaptererror();",
							"@先定个小目标,",
							"@比如1秒记住:",
							"@www.skjvvx.cc",
							"@书客居手机版阅读网址:",
							"@m.skjvvx.cc"
							}
		下一页网址提取正则 = `\<a href="(\S+?)">下一章\</a>`;
		下一页网址前缀 = "https://www.skjvvx.cc";
		正文标题提取正则 = `\<div class="content">\s*?\<h1>(.+?)\</h1>`;
	},
	{
		网站网址 = "https://www.bageddd.com";
		目录提取正则 = `\<dd>\<a href="(.+?)">(.+?)\</a>\</dd>`;
		文章网址前缀 = "https:";
		文章多页网址替换文本 = {".html"};
		文章正文换行符号正则 = {"@<p>","@<br>","@<br />"};//字符串或数组
		文章正文div的id = "content";
		文章正文段前空格文本 = "  ";
		文章内容忽略文本正则 = {}
		下一页网址提取正则 = `\<a href="(\S+?)">下一章\</a>`;
		下一页网址前缀 = "https:";
		正文标题提取正则 = `\<div class="bookname">.+?\<h1>(.+?)\</h1>`;
	}
	*****/

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

卢光庆

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值