物流大超市

 找回密码
 注册
查看: 441|回复: 0
打印 上一主题 下一主题

了解:php抓取第方网站的小说内容

[复制链接]
跳转到指定楼层
1#
kaixun 发表于 2023-2-23 12:45:33 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

这里用到QL这个第方插件,安装要求程序网站的相关问题可以到网站了解下,我们是业内领域专业的平台,您如果有需要可以咨询,相信可以帮到您,值得您的信赖!



=71


安装














或者直接下载


开箱即用:1QPMUL5HVJ4L7UY0LM


_()-RP()L;引入插件


$QL=\QL\QL();


$='';需要获取小说的链接


$=[];


根据页面获取书籍信息


$=[


''=['',''],获取小说称


''=['',''],获取小说的链接


''=['',''],获取小说的作者


''=['',''],获取小说的状态


];





$='__';切片选择器


('UTF-8','GB')转码


$=$QL-($)-($)-($)-H()-('UTF-8','GB')-()-D();


($-());;





根据的机构去获取书籍内容,比如这个

书是在下面的,链接是在下面的





:切片选择工具就是书籍循环的外包结构可以将书籍分割成一个一个的数组


:可以将内容中的部分内容过滤掉


$=STR


=





=作者:





这是正文内容段落1





这是正文内容段落2





这是正文内容段落3





这是广告


这是版权声明!





STR;





$=[


''=['#','']


];





$=QL:$)


-($)


-()


-D(($){


$=QL:$['']);


$-(',:,:')-();


$['']=$-('')-();


$;


});


A


(


[0]=A


(


[]=这是正文内容段落1





这是正文内容段落2





这是正文内容段落3


)





)











_($-());





$-(',:,:')-();





:作用于内容的转码,原来的'GB'获取的内容会出现乱码,需要将他转换成-8。

$=STR





这是内容





STR;


$=[


''=[':','']


];


$=QL:$)-($)


-('UTF-8','GB')-()-D();





设置输入输出编码,并移除头部


如果设置输入输出参数仍然法解决乱码,那就使用H()方法移除头部





H:过滤掉头部





这样我们就将这个页面的书籍列表都获取下来












让后通过循环去获取分页的数据,根据书籍链接获取书籍的章节,封面等其他数据,比较后通过章节链接获取到小说内容。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|Archiver|手机版|物流大超市 ( 桂ICP备2025065447号 )

GMT+8, 2026-1-21 06:22 , Processed in 0.062338 second(s), 16 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表