以下是一个简单的PHP网页爬虫实例,用于从网页中抓取数据。我们将使用PHP的cURL库来发送HTTP请求,并解析HTML内容。

1. 环境准备

确保你的服务器上已安装PHP和cURL库。

实例网页爬虫PHP:从零开始实现数据抓取 设计风格

2. PHP代码

```php

// 目标网页URL

$url = 'http://example.com/page';

// 初始化cURL会话

$ch = curl_init($url);

// 设置cURL选项

curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);

curl_setopt($ch, CURLOPT_HEADER, false);

// 执行cURL会话

$response = curl_exec($ch);

// 关闭cURL会话

curl_close($ch);

// 解析HTML内容

$dom = new DOMDocument();

@$dom->loadHTML($response);

// 查找所有目标元素

$elements = $dom->getElementsByTagName('div');

// 创建结果数组

$result = [];

// 遍历所有目标元素

foreach ($elements as $element) {

// 获取元素文本内容

$text = $element->nodeValue;

// 将内容添加到结果数组

$result[] = $text;

}

// 打印结果

echo "