物流大超市

标题: 关于:php抓取第方网站的小说内容 [打印本页]

作者: kaixun    时间: 2023-2-23 17:02
标题: 关于:php抓取第方网站的小说内容

这里用到QL这个第方插件,安装要求小程序源码的相关知识也可以到网站具体了解一下,有专业的客服人员为您全面解读,相信会有一个好的合作!



=71


安装














或者直接下载


开箱即用:1QPMUL5HVJ4L7UY0LM


_()-RP()L;引入插件


$QL=\QL\QL();


$='';需要获取小说的链接


$=[];


根据页面获取书籍信息


$=[


''=['',''],获取小说称


''=['',''],获取小说的链接


''=['',''],获取小说的作者


''=['',''],获取小说的状态


];





$='__';切片选择器


('UTF-8','GB')转码


$=$QL-($)-($)-($)-H()-('UTF-8','GB')-()-D();


($-());;





根据的机构去获取书籍内容,比如这个

书是在下面的,链接是在下面的





:切片选择工具就是书籍循环的外包结构可以将书籍分割成一个一个的数组


:可以将内容中的部分内容过滤掉


$=STR


=





=作者:





这是正文内容段落1





这是正文内容段落2





这是正文内容段落3





这是广告


这是版权声明!





STR;





$=[


''=['#','']


];





$=QL:$)


-($)


-()


-D(($){


$=QL:$['']);


$-(',:,:')-();


$['']=$-('')-();


$;


});


A


(


[0]=A


(


[]=这是正文内容段落1





这是正文内容段落2





这是正文内容段落3


)





)











_($-());





$-(',:,:')-();





:作用于内容的转码,原来的'GB'获取的内容会出现乱码,需要将他转换成-8。

$=STR





这是内容





STR;


$=[


''=[':','']


];


$=QL:$)-($)


-('UTF-8','GB')-()-D();





设置输入输出编码,并移除头部


如果设置输入输出参数仍然法解决乱码,那就使用H()方法移除头部





H:过滤掉头部





这样我们就将这个页面的书籍列表都获取下来












让后通过循环去获取分页的数据,根据书籍链接获取书籍的章节,封面等其他数据,比较后通过章节链接获取到小说内容。




欢迎光临 物流大超市 (https://www.9999956.com/bbs/) Powered by Discuz! X3.2