php使用正则表达式获取字符串中的URL

2023年5月26日上午8:26 • PHP

下面是具体步骤和示例说明：

1. 利用PHP内置函数获取HTML字符串

在使用正则表达式前，我们需要先获取HTML字符串。可以使用PHP内置的函数，如file_get_contents或curl等。

$htmlStr = file_get_contents('http://www.example.com');

2. 构建正则表达式

构建正则表达式是本次攻略的重点，因为不同的网页结构有不同的标记和规则。

以下是一个基本的URL匹配正则表达式示例：

preg_match_all('/(http[s]?:\/\/[^\s]*)/i', $htmlStr, $match);

该正则表达式的含义是：匹配以http或https协议开头的URL。

3. 执行正则匹配

接下来，我们使用preg_match_all函数执行正则匹配。

preg_match_all('/(http[s]?:\/\/[^\s]*)/i', $htmlStr, $match);

函数的第一个参数是正则表达式，第二个参数是待匹配的文本，第三个参数是匹配结果数组。上述代码执行后，$match会返回一个二维数组，包含了所有匹配到的URL。

4. 获取匹配结果

我们可以使用foreach循环遍历$match数组，获取所有匹配到的URL。

foreach($match[0] as $url) {
    echo $url . "<br/>";
}

示例说明

以下是一个示例：使用php获取一篇博客的HTML字符串，然后提取其中的所有图片链接。

// 获取博客HTML字符串
$htmlStr = file_get_contents('https://www.example.com/blog/123');

// 构建匹配图片链接的正则表达式
preg_match_all('/<img.*?src="(.*?)".*?>/is', $htmlStr, $match);

// 遍历所有匹配结果，输出链接
foreach($match[1] as $imgUrl) {
    echo $imgUrl . "<br/>";
}

以下是另一个示例：使用php获取一个网站的HTML字符串，然后提取其中的所有外部链接。

// 获取网站HTML字符串
$htmlStr = file_get_contents('https://www.example.com');

// 构建匹配外部链接的正则表达式
preg_match_all('/(http[s]?:\/\/[^\s]*)/i', $htmlStr, $match);

// 遍历所有匹配结果，输出链接
foreach($match[0] as $url) {
    echo $url . "<br/>";
}

以上就是使用php正则表达式获取字符串中URL的完整攻略。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：php使用正则表达式获取字符串中的URL - Python技术站

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

PHP similar_text 字符串的相似性比较函数

上一篇 2023年5月26日

php 判断字符串中是否包含html标签

下一篇 2023年5月26日

用PHP实现维护文件代码

下面是我对于“用PHP实现维护文件代码”的完整攻略： 1. 概述在开发过程中，我们通常需要维护很多代码文件。如果手动维护，很容易出现代码冲突、遗忘等问题。因此，我们需要一种自动化的方式来维护代码文件。在这篇文章中，我将为大家介绍一种用PHP实现维护文件代码的方法。 2. 目标实现代码的自动合并、冲突检测和恢复；实现代码的版本控制；实现代码的备份和还原…

PHP 2023年5月27日
000
PHP实现倒计时功能

下面是PHP实现倒计时功能的完整攻略。步骤一：定义倒计时结束时间首先，你需要定义倒计时结束的时间，可以用PHP中的date()函数进行定义。比如，我们定义倒计时结束时间为2022年1月1日 00:00:00。 $endtime = strtotime(‘2022-01-01 00:00:00’); 步骤二：计算倒计时剩余时间接下来，你需要计算倒计时剩余…

PHP 2023年5月27日
000
php array_map使用自定义的函数处理数组中的每个值

下面是关于 “php array_map使用自定义的函数处理数组中的每个值” 的完整攻略。什么是 array_map 函数？ array_map 函数是 PHP 标准库中的函数，它将一个数组的所有元素通过某个回调函数映射到另一个数组中，并返回新的数组。通俗的来说，就是通过一个函数对一个数组中的每个元素做处理，得到一个经过处理后的新数组。 array_map…

PHP 2023年5月26日
000
如何在PHP中操作临时文件

操作临时文件是在Web开发中常见的需求之一，PHP为我们提供了方便的操作临时文件的方式。下面我将详细讲解如何在PHP中操作临时文件。创建临时文件 PHP中提供了tmpfile()函数用于创建一个临时文件并返回一个打开文件指针。该函数创建的临时文件只在脚本执行期间存在，当脚本结束时会自动删除。 // 创建临时文件 $temp = tmpfile(); // …

PHP 2023年5月26日
000
PHP创建XML的方法示例【基于DOMDocument类及SimpleXMLElement类】

下面就是关于PHP创建XML的方法示例的详细讲解，分为DOMDocument类和SimpleXMLElement类两部分。 DOMDocument类 1. 创建一个基本的XML文档首先，我们需要先创建一个DOMDocument对象，然后在这个对象上创建XML元素和属性，最后将这个文档保存为XML文件。 // 创建DOMDocument对象 $doc = n…

PHP 2023年5月27日
000
php将服务端的文件读出来显示在web页面实例

下面是php将服务端的文件读出来显示在web页面的完整攻略。准备工作在本地或者服务器上安装PHP解释器创建一个php文件，并将其命名为index.php 在index.php文件中写入代码，用于读取服务端文件并将其显示在web页面上。读取服务端文件我们可以使用常用的PHP文件读取函数file_get_contents()或fopen()与fread…

PHP 2023年5月26日
000
编写自己的php扩展函数

编写自己的PHP扩展函数需要遵循以下步骤：编写C代码：首先需要编写C代码实现相应的功能。编写函数定义：为了在PHP中使用该C代码，需要在PHP中定义一个函数。编写扩展结构体：需要定义一个扩展结构体，该结构体包含本扩展所提供的所有函数。创建配置文件：需要创建一个配置文件来指定生成的扩展的名称，版本号等信息。编译和安装：最后需要编译并安装扩展，在PHP…

PHP 2023年5月23日
000
实现php加速的eAccelerator dll支持文件打包下载

为了实现php加速，我们可以使用eAccelerator工具。eAccelerator是一个开源的PHP加速器，可以通过编译成dll扩展的方式在PHP中使用。本文将详细讲解如何打包eAccelerator dll支持文件以供下载和使用。准备工作在开始之前，需要准备一些工具和环境: PHP安装包：从PHP官网中下载PHP的稳定版本。 Microsoft V…

PHP 2023年5月24日
000

合作推广

合作推广

返回顶部