• 微信
您当前的位置:首页  > 文章 >  小说内容页分页用关关采集,如何写规则?

小说内容页分页用关关采集,如何写规则?

作者:admin 时间:2020-01-14 阅读数:134人
开始小编也是相当的纠结,因为这茫茫一片网络世界,百度,360,各大搜索搜了个昏天黑地,也没有找到教程!

 

后来只能自己摸索起来,

其实吧在关关10的里面是可以采集分页的因为有那两个选项

前面的规则写法就不多复述了

只讲这两项规则的写法

小说内容页分页用关关采集,如何写规则?

这两项有了,但网上一般的规则写法,都没有讲到这两项

经过电脑屋小编的不断尝试。终于明白如下

小说内容页分页用关关采集,如何写规则?

这一步很好理解,只要找出分页代码,用正则替换就好了!

其实真正把电脑屋小编难住很久的是下面一项

获取章节内容中的分页编码的正则

关键这里获取到的分页编码如何实用进去
当时源网址格式是假如是

www.dnwfb.com/小说编号-章节编号_分页号.html

开始我用正则

/d*-/d*_(/d*).html

替换后,测试采集出来内容很多了,但发现章节第二页内容和源站第二页内容不一致,
后来经研究,原来在这个分页编码的正则里获取到的数值是直接替换章节编号的,所以电脑屋小编直接把章节编号和分页号当成一个值去替换,
后来就变成了/d*-(/d*_/d*).html,经测试完美成功,采集到了小说内容页的第二页!

 

 

声明

源码下载不顺利,比如源码在百度网盘的有时会被无故取消等,请联系QQ:46667551
本站大部分下载资源收集于网络,但除特别说明之外,基本全部亲自测试可用!
但由于某些源码的更新迭代,比如微信小程序官方接口的变动等原因,
如时间过长,可能会造成本可以使用的代码出现问题,下载前请斟酌!
本站资源仅供学习和交流使用,版权归原作者所有,请在下载后24小时之内自觉删除。
若作商业用途,请购买正版,由于未及时购买和付费发生的侵权行为,使用者自行承担,概与本站无关。

原文链接:https://www.dnwfb.com//1061.html,转载请注明出处