推荐专题：

100字范文 > php自动采集列表内容 thinkphp自动采集怎么实现 - QueryList

php自动采集列表内容 thinkphp自动采集怎么实现 - QueryList

时间：2024-04-25 03:55:50

相关推荐

php自动采集列表内容 thinkphp自动采集怎么实现 - QueryList

...控项。/home/orabbix/conf/query.props这个文件中有一个QueryList,提供了需要的监控项，这个时候我们需要监控闪回区的空间使用，我们定义监控项为:arch_area_usage_perQueryList=xxxxxxx, arch_area_usage_per然后对于这个监控项，我...

thinkphp实现自动采集功能的三种方法：

方法一：QueryList

个人感觉比较好用，采集详情比较不错的选择，但是采集复杂一点的列表，不好用。具体使用：

控制器示例：public function index(){

// 使用采集类

// 使用手册：/php/php-QueryList3-ThinkPHP.html

import('Org.QL.QueryList');

$url = "/gqqg/";

$reg = array();

$reg['title'] = array('.sulist_title','text');

$reg['shuliang'] = array('.su_li1','html');

$obj = new \QueryList($url,$reg);

$data = $obj->jsonArr;

// foreach($data as $v){

// echo "

".$v['title'].'___'.$v['shuliang']."

";

// }

p($data);

}

相关推荐：《ThinkPHP教程》

方法二：simple_html_dom

这个方法比较适合采集一点结构简单的页面，HTML标签的类名比较明确的页面，还不错。具体使用：

控制器示例：public function index(){

// 参考文档：http://microphp.us/plugins/public/microphp_res/simple_html_dom/manual.htm#section_quickstart

// 下载地址：/samacs/simple_html_dom/edit/master/simple_html_dom.php

// 使用方法：/topic/21635.html

import("Org.Util.simple_html_dom", '', '.php');

$html = file_get_html('/gqqg/');

$ret = $html->find('.supply_list_box ul',0)->first_child();

foreach($ret as $v){

echo $v;

};

}

方法三：获取页面HTMl，进行正则匹配采集

举例一个Demo：

采集一个页面：

/gqqg/

我要获取上面的四个信息：标题，数量，时间，跳转链接。

获取这些信息，通过上面两种方法都采集不到，最后才选用的正则来采集。具体方法：public function index(){

$url = "/gqqg/";

// /gqqg-p1.html

$supplyDB = M('supply');

$urlList = array();

$array = array();

for($x=1; $x<=1; $x++) {

array_push($urlList,"/gqqg-p".$x.".html");

};

foreach($urlList as $v){

$curPageList = $this->getInfo($v);

array_push($array,$curPageList);

};

foreach($array as $v){

foreach($v as $vv){

//echo $vv['title']."__".$vv['weight']."__".$vv['time']."

";

$data = array();

$data['title'] = $vv['title'];

$data['weight'] = $vv['weight'];

$data['add_time'] = $vv['add_time'];

$data['url'] = $vv['url'];

//$res = $supplyDB->add($data);

//echo $res;

echo "

".$vv['title']."

".$vv['weight']."

".$vv['add_time']."

".$vv['url']."

";

}

}

// 获取信息

//$curPageList = $this->getInfo($html);

//p($curPageList);

}

private function getInfo($url){

$html = $this->getHtml($url);

$array = array();

// 匹配所有的标题

preg_match_all("#(.*?)

#",$html,$matches);

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。

相关阅读

php 采集教程 php如何获取html页面title标签里面的内容 – PHP基础 – 前端 thinkphp5实现登录

2023-09-28

简单记录thinkphp5使用Querylist插件做采集

2019-03-01

php querylist ThinkPHP中使用QueryList3

2019-02-15

php querylist 404 Querylist批量采集碰到404咋办

2020-09-22

扩展阅读

: Thinkphp发布文章获取第一张图片为缩略图实现方法

: PHP 实现中文分词搜索功能

: php实现简单文章搜索功能

: PHP 实现中文分词搜索功能

: 基于PHP的个人网站设计与实现论文

: PHP文本和图片审核使用百度ai完美实现

最近发布

去钓鱼-小学生日记100字

2024-08-07

探索超能力世界：假如我拥有超人般的超能力

2024-08-07

春节写作100字：迎接新年的春天

2024-08-07

儿童文学的魅力：读后感100字

2024-08-07

倡导构建绿色家园的100字作文

2024-08-07

读水浒传有感100字（精选12篇）

2024-08-07

推荐专题

诚实的故事100字我喜欢的体育运动100字我的同学结尾100字感恩的小故事100字升旗手自我介绍100字仙人掌的日记100字城南旧事的读后感100字夏雨作文100字观察植物100字大学校运会加油稿100字运动会开场白100字晨练日记100字广播稿100字青春励志关于长城的故事100字庆祝国庆作文100字