获取网页里所有图片并存入数组的方法可以分为以下几个步骤:
- 使用PHP的file_get_contents函数获取目标网页的HTML代码;
- 使用PHP的preg_match_all()函数匹配其中的图片地址,提取出图片URL;
- 将提取出来的图片URL存入一个数组。
下面是代码示例:
<?php
// 目标网页URL
$url = "https://example.com";
// 获取网页HTML代码
$html = file_get_contents($url);
// 匹配图片URL
preg_match_all('/<img[^>]*src=[\'"]([^\'"]+)[\'"][^>]*>/i', $html, $matches);
// 存储所有图片URL的数组
$image_urls = $matches[1];
// 打印输出所有图片URL
print_r($image_urls);
?>
上述代码中,使用了正则表达式来匹配HTML代码中的图片URL,将匹配结果存储在一个数组中,并打印输出。
另一个示例代码使用了DOM解析器,解析HTML代码并提取图片URL:
<?php
// 目标网页URL
$url = "https://example.com";
// 创建DOM解析器对象
$dom = new DOMDocument();
libxml_use_internal_errors(true); // 忽略DOM解析时的错误
// 加载网页HTML代码
$html = file_get_contents($url);
$dom->loadHTML($html);
// 获取所有图片标签
$image_tags = $dom->getElementsByTagName('img');
// 存储所有图片URL的数组
$image_urls = array();
// 遍历所有图片标签,提取图片URL并存入数组
foreach ($image_tags as $tag) {
$image_urls[] = $tag->getAttribute('src');
}
// 打印输出所有图片URL
print_r($image_urls);
?>
使用DOM解析器的好处是可以忽略代码中可能存在的不规范HTML标签,解析效果更稳定可靠。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:php获取网页里所有图片并存入数组的方法 - Python技术站