物流大超市

标题: 聊聊php采集器QueryList V3的例运用介绍 [打印本页]

作者: kaixun    时间: 2023-2-23 22:40
标题: 聊聊php采集器QueryList V3的例运用介绍

要现插件QLV3采集器的功能,首先就是要下载Q和QL,我们使用的是32,所以把这两个文件放到如下图所示的位置:喝酒神器的相关知识也可以到网站具体了解一下,有专业的客服人员为您全面解读,相信会有一个好的合作!









然后在控制器上,使用('CQ');('CQL');引入这两个文件,然后使用命空间QL\QL;引入QL类,如下图所示:











然后使用QL::方法,即可调用QL类的方法,如下图所示,我们来采集一个址:











$是我们要采集的一个址,我们打开这个页面,如下图:














然后查看这个页面的源代码,如下所示:











上面的源代码划红圈的位置,我们需要采集的是页的URL,标题,图片个参数,这样QL采集器的规则如下:


$=(=('',''),


''=('-',''),


''=('-','-'));


这个就是在这个页面里,获取,,这个参数的匹配到符合条件的数组,至于这个规则为何这样写,可以自行查看QLV3的开发文档,这里不再赘述,然后使用


$_=QL:($,$)-;执行采集程序,就能获取到如下数组:











这样就可以对数组进行处理了,首先我们注意到这个图片的路径是远程的绝对地址,如果直接存到数据库表中,随时可能因为某种原因打开,所以就需要把图片保存到服务器上,所以需要运用到以下方法:











$_是远程的图片地址,如上面数组的的路径,$_是服务器上要保存的文件地址,如$_='U3';


这样通过$-($_,$_)调用这个方法后即可保存图片,这样图片的地址就能转换成服务器上的相对地址或根目录地址了。


以上是对QLV3的例运用介绍,其还有很多比较用的技巧没讲,例如内容过滤,获取内容乱码如何解决等。如果有时间下次再讲一下把采集数据处理,先采集列表页面,再通过列表的链接采集到文章页面,再把它保存到数据库中的处理过程。




欢迎光临 物流大超市 (https://www.9999956.com/bbs/) Powered by Discuz! X3.2