【编码】PHP中文路径问题详解

1. 问题

低版本的PHP可能会遇到不支持中文路径的情况:

 (1) require('http://localhost/中文路径/test.php');

 (2) require('\中文路径\test.php');

 (3) $file = fopen('http://localhost/中文路径/test.php');

 (4) $file = fopen('\中文路径\test.php');

 (5) 通过浏览器访问: http://127.0.0.1/中文路径/test.php

在Windows10+Apache2.4.41+PHP5.6.40环境下,测试文件编码为UTF-8,会发现除了用fopen打开URL外(3),其他情况(包括用fopen打开物理路径)PHP都会报错:No such file or directory

注:使用fopen('url')或require('url')需要在php.ini中进行配置

  ; Whether to allow the treatment of URLs (like http:// or ftp://) as files.
  ; http://php.net/allow-url-fopen
  allow_url_fopen = On
  ; Whether to allow include/require to open URLs (like http:// or ftp://) as files.
  ; http://php.net/allow-url-include
  allow_url_include = On

查看浏览器请求头,(5)的“中文路径”也被编码为UTF-8,如果对路径字符串进行转码:

 (1) require(iconv('utf-8', 'gbk', 'http://localhost/中文路径/test.php'));

 (2) require(iconv('utf-8', 'gbk',  '\中文路径\test.php');

 (3) $file = fopen(iconv('utf-8', 'gbk', 'http://localhost/中文路径/test.php'));

 (4) $file = fopen(iconv('utf-8', 'gbk',  '\中文路径\test.php');

 (5) 通过浏览器访问: http://127.0.0.1/php/%D6%D0%CE%C4%C2%B7%BE%B6/form.php

发现:(2)和(4)成功运行,(1),(3),(5)报错,但这次不是PHP报错,而是Apache报错:HTTP/1.1 403 Forbidden

 

物理路径(utf-8)

物理路径(gbk)

URL(utf-8)

URL(gbk)

fopen

Invalid argument/

No such file or directory

成功

成功

HTTP/1.1 403 Forbidden

require

Invalid argument/

No such file or directory

成功

Invalid argument/

No such file or directory

HTTP/1.1 403 Forbidden

据此得出结论:

  • 用require和fopen打开URL,会向Apache服务器请求资源,但Apache只支持解析UTF-8编码的URL
  • 用require和fopen打开物理路径,直接与Windows文件系统交互,即ANSI编码

注:require会调用compile_filename,而在compile_filename会进行路径解析。

但是,为什么用浏览器或者require打开UTF-8或者GBK编码的URL都会失败呢?

2. PHP与Apache主要通信方式

2.1 CGI方式

CGI英文叫做公共网关接口,就是Apache在遇到PHP脚本的时候会将PHP程序提交给CGI应用程序(php-cgi.exe)解释,解释之后的结果返回给Apache,然后再返回给相应的请求用户。这种模式速度慢(php解释器不是常驻内存的)、占用空间(请求一次开启一次cgi)。已经被fast-cgi代替。

在Apache中配置:

Action application/x-httpd-php “/php/php-cgi.exe”

2.2 模块化方式(默认)

PHP作为Apache的一个模块(mod_php)运行,随apache一起启动,属于一个进程,之间的通信是内部通信。mod_php 这种嵌入的方式最大的弊端就是内存占用大,不论是否用到 PHP 解释器都会将其加载到内存中,典型的就是处理CSS、JS之类的静态文件是完全没有必要加载解释器。

【编码】PHP中文路径问题详解

 

2.3 FastCGI方式

这种形式是CGI的加强版本,CGI是单进程,多线程的运行方式,程序执行完成之后就会销毁,所以每次都需要加载配置和环境变量fork-and-execute(创建-执行)。而FastCGI则不同,FastCGI 像是一个常驻 (long-live) 型的 CGI,它可以一直执行着,只要激活后,不会每次都要花费时间去 fork 一次。FastCGI进程管理器自身初始化,启动多个CGI解释器进程 (在任务管理器中可见多个php-cgi.exe)并等待来自Web Server的连接。FastCGI与Apache是两个独立的进程,通过端口通信。

它的具体实现到php中就是php的php-fpm模块,但是在apache中是用的专门的fastcgi模块,需要下载.so文件,php-fpm在php5.3以后不再作为第三方的模块而是集成到了php中,它会提前的开启多个cgi程序,管理这些进程,并提供方式合理有效的调度,保证了并发性。

3. Apache与PHP交互过程

3.1 Apache生命周期

【编码】PHP中文路径问题详解

3.2 Apache处理流程

【编码】PHP中文路径问题详解

 

  1. Post-Read-Request阶段: 在正常请求处理流程中,这是模块可以插入钩子的第一个阶段。对于那些想很早进入处理请求的模块来说,这个阶段可以被利用。
  2. URI Translation阶段 :  Apache在本阶段的主要工作:将请求的URL映射到本地文件系统。模块可以在这阶段插入钩子,执行自己的映射逻辑。mod_alias就是利用这个阶段工作的。
  3. Header Parsing阶段 :  Apache在本阶段的主要工作:检查请求的头部。由于模块可以在请求处理流程的任何一个点上执行检查请求头部的任务,因此这个钩子很少被使用。mod_setenvif就是利用这个阶段工作的。
  4. Access Control阶段 :  Apache在本阶段的主要工作:根据配置文件检查是否允许访问请求的资源。Apache的标准逻辑实现了允许和拒绝指令。mod_authz_host就是利用这个阶段工作的。
  5. Authentication阶段 :  Apache在本阶段的主要工作:按照配置文件设定的策略对用户进行认证,并设定用户名区域。模块可以在这阶段插入钩子,实现一个认证方法。
  6. Authorization阶段 :  Apache在本阶段的主要工作:根据配置文件检查是否允许认证过的用户执行请求的操作。模块可以在这阶段插入钩子,实现一个用户权限管理的方法。
  7. MIME Type Checking阶段 :  Apache在本阶段的主要工作:根据请求资源的MIME类型的相关规则,判定将要使用的内容处理函数。标准模块mod_negotiation和mod_mime实现了这个钩子。
  8. FixUp阶段 :  这是一个通用的阶段,允许模块在内容生成器之前,运行任何必要的处理流程。和Post_Read_Request类似,这是一个能够捕获任何信息的钩子,也是最常使用的钩子。
  9. Response阶段 : Apache在本阶段的主要工作:生成返回客户端的内容,负责给客户端发送一个恰当的回复。这个阶段是整个处理流程的核心部分。
  10. Logging阶段 :  Apache在本阶段的主要工作:在回复已经发送给客户端之后记录事务。模块可能修改或者替换Apache的标准日志记录。
  11. CleanUp阶段 : Apache在本阶段的主要工作:清理本次请求事务处理完成之后遗留的环境,比如文件、目录的处理或者Socket的关闭等等,这是Apache一次请求处理的最后一个阶段。

3.3 mod_php工作周期

  1. Apache接受请求
  2. Apache传递请求给mod_php
  3. mod_php定位磁盘文件,并加载到内存中
  4. mod_php编译源代码成为opcode树(APC)
  5. mod_php执行opcode树

4. 结论

4.1 两次资源检查

根据上述工作流程可大致推断:

  1. 通过浏览器访问url产生一个request,Apache服务器会检查是否允许访问请求的资源,要求url是UTF-8编码;
  2. mod_php会通过Apache传递的请求定位磁盘文件,这里可能要求是GBK编码,因此PHP报错(仅猜测,具体Apache传递给PHP的请求是什么格式暂时不清楚);

4.2 远程文件

对于require(url),这个过程可能更加复杂:

参照:PHP: include - Manual

安全警告

远程文件可能会经远程服务器处理(根据文件后缀以及远程服务器是否在运行 PHP 而定),但必须产生出一个合法的 PHP 脚本,因为其将被本地服务器处理。

根据这条警告的意思,如果远程服务器在运行PHP,通过include/require请求的PHP文件可能会被处理,然后收到一个包含了静态的HTML的PHP脚本,如果远程服务器没有运行PHP,那么将收到原始的PHP脚本在本地进行执行。由于测试请求的是本地的PHP文件,远程服务器就相当于本地环境,远程服务器同样进行了两次资源检查导致出错。

4.3 替代解决方案

设置->语言设置->管理语言设置->更改系统区域设置->勾选Beta版使所有程序都用Unicode UTF-8提供语言支持,但在运行其他文件时可能出现乱码。

4.4 使用PHP7

如果使用PHP7,以上问题全都不会出现。

参考

  1. Apache运行机制 - 简书 (jianshu.com)
  2. POST-READ-REQUEST阶段 - 豆丁网 (docin.com)
  3. php底层深度探索(4) ---Apache运行阶段分析 王泽宾 - 编程宝库 - 博客园 (cnblogs.com)
  4. apache是怎么运行php的_PHP与WEB服务器是如何交互的_weixin_39761481的博客-CSDN博客
  5. Windows下Apache服务器运行PHP的三种运行方式(php_mod、cgi、fastcgi) | 夜风博客 (homedt.net)
  6. (5条消息) 深入理解php原理之include include_once require require_once_冰心丹的博客-CSDN博客

 

原文链接:https://www.cnblogs.com/victorique-de-blois/p/16926739.html

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:【编码】PHP中文路径问题详解 - Python技术站

(0)
上一篇 2023年4月18日
下一篇 2023年4月18日

相关文章

  • 利用php抓取蜘蛛爬虫痕迹的示例代码

    让我来为您讲解“利用php抓取蜘蛛爬虫痕迹的示例代码”的完整攻略。 什么是蜘蛛爬虫痕迹? 蜘蛛爬虫是网络爬虫的一种,它能够在网络上自动抓取网页,并进行分析和处理。在网络访问中,蜘蛛爬虫的行为会影响网站的流量和分析数据。由于蜘蛛爬虫往往具有明显的行为特征,因此可以利用php代码对蜘蛛爬虫进行抓取和监控。 利用php抓取蜘蛛爬虫痕迹的示例代码 代码说明 以下代码…

    PHP 2023年5月27日
    00
  • PHP中__get()和__set()的用法实例详解

    下面是关于“PHP中__get()和__set()的用法实例详解”的攻略: 什么是__get()和__set() __get() 和 __set() 是两个魔术方法(Magic Method)。 __get() 和 __set() 可以让我们在访问或者设置一个对象的属性时,可以添加额外的处理逻辑。 __get()的用法 当我们访问一个对象属性时,如果该属性不…

    PHP 2023年5月25日
    00
  • PHP 用数组降低程序的时间复杂度

    下面是PHP用数组降低程序时间复杂度的完整攻略: 1. 什么是时间复杂度? 时间复杂度是算法执行所需的时间,通常用 “O(n)” 表示,其中 n 是程序输入的规模或者说大小。时间复杂度可以用来衡量算法的效率,通常我们会尽可能降低时间复杂度。 2. 数组降低时间复杂度的原理 数组是一种数据结构,用于存储固定大小的元素序列。在编程过程中,使用数组可以降低时间复杂…

    PHP 2023年5月26日
    00
  • PHP中的替代语法简介

    关于“PHP中的替代语法简介”的详细讲解,可以分为以下几个方面来讲解。 什么是PHP中的替代语法 在PHP中,可以使用替代语法来简化代码的书写。替代语法和常规语法本质上是相同的,只是在某些方面写法略有不同。常规语法中的大括号({ })用于标记代码块的开始和结束,而替代语法使用冒号(:)和关键字endif、endwhile和endforeach等来标记代码块的…

    PHP 2023年5月23日
    00
  • ThinkPHP防止重复提交表单的方法实例分析

    标题:ThinkPHP防止重复提交表单的方法实例分析 正文: 在web开发过程中,防止重复提交表单是一项非常重要的安全措施。ThinkPHP框架提供了一些防止重复提交表单的方法,本文将对这些方法进行分析并给出两个示例说明。 防止重复提交表单方法 在ThinkPHP框架中,有三种方法可以防止重复提交表单: 隐藏表单令牌 自动检测表单令牌 开启验证码 隐藏表单令…

    PHP 2023年5月23日
    00
  • php checkbox复选框值的获取与checkbox默认值输出方法

    当我们需要用户从多个选项中进行选择时,就可以使用复选框。PHP中获取复选框的值对于开发者来说非常重要。在本文中,我们将详细讲解如何使用PHP获取复选框的值并将默认值输出到HTML中。 获取复选框的值 要获取复选框的值,我们需要通过POST或GET方法将数据传递到PHP文件中。我们将使用HTML表单来演示。 HTML表单 <form action=&qu…

    PHP 2023年5月26日
    00
  • PHP编程中的常见漏洞和代码实例

    那我来详细讲解一下“PHP编程中的常见漏洞和代码实例”的完整攻略。 什么是常见漏洞 在 PHP 编程中常见的漏洞有很多种,这里将介绍其中比较常见的几种: SQL 注入 在 PHP 开发中,如用户登陆、搜索功能等,都需要通过 SQL 语句从数据库中查询数据。而 SQL 注入漏洞就是攻击者将恶意代码注入到 SQL 语句中,从而突破程序的安全防护措施,访问、篡改、…

    PHP 2023年5月23日
    00
  • php转换上传word文件为PDF的方法【基于COM组件】

    PHP转换上传Word文件为PDF的方法【基于COM组件】 在Windows系统中,可以利用COM组件轻松将Word文件转换成PDF格式。本文将介绍如何使用COM组件将上传的Word文件转换成PDF格式,并提供两个示例。 一、首先,确认系统是否安装Microsoft Office,因为转换Word到PDF需要依赖Microsoft Office。 二、在PH…

    PHP 2023年5月27日
    00
合作推广
合作推广
分享本页
返回顶部