PHP 与 UTF-8 的最佳实践详细介绍

发布时间:2022-04-30 发布网站:脚本宝典
脚本宝典收集整理的这篇文章主要介绍了PHP 与 UTF-8 的最佳实践详细介绍脚本宝典觉得挺不错的,现在分享给大家,也给大家做个参考。

PHP中的字符串、编码、UTF-8》一文中描述了一些列的基础知识,比较枯燥,现在来说点有用的——PHP 字符串处理的最佳实践,本文是“PHP、字符串、编码、UTF-8”相关知识的第二部分。先说结论—— 在 PHP 中的各个方面使用 UTF-8 编码。

PHP 语言层面是不支持 Unicode字符集的,但是可以通过 UTF-8 编码能处理大部分问题。

最佳实践就是明确知道输入编码(不知道就检测),内部统一转换为 UTF-8 编码,输出编码也统一是 UTF-8编码。

PHP 层面如何处理 UTF-8

当操作 Unicode 字符集的时候,请务必安装 mbstring 扩展,并使用相应的函数代替原生的字符串函数。举个例子,一个文件编码为 UTF-8 的 PHP 代码,假如使用 strlen() 函数是@L_406_16@的,请使用 mb_strlen() 函数代替。

mbstring 扩展大部分的函数都需要基于一个编码(内部编码)来处理,请务必统一使用 UTF-8 编码,这个大部分可以在 PHP.INI 中配置。

PHP 5.6 开始,default_charset 配置可以替换 mbstring.http_input,mbstring.http_output 。

另外一个重要的配置就是 mbstring.language,这个认值是 Neutral(UTF-8)。

注意文件编码和 mbstring 扩展的内部编码不是同一个概念。

概括的说来:

  • PHP.INI 中涉及到 mbstring 扩展的部分尽量使用 UTF-8。
  • 请用 mbstring 扩展函数代替原生字符串操作函数
  • 在使用相关函数的时候,请务必了解你操作的字符的编码是什么,在使用对应函数的时候,显示的写上 UTF-8 编码参数,比如 htMLentITies() 函数的第三个参数显示写上 UTF-8。

文件 IO 操作 如何处理 UTF-8

这里举个例子,假如你要打开一个文件,但是不知道文件内容是什么编码的,那么如何处理呢?

最佳实践就是,在打开的时候统一转换成 UTF-8,修改内容后就再转回原来的编码并保存到文件。看代码把:

<PRe class="brush:PHp;"> if ( mb_internal_encoding()!="UTF-8") { mb_internal_encoding("UTF-8"); }

$file = "file.txt"; //一个编码为gbk的中文文件
$str= file_get_contents($file);
//不管来是什么编码,统一显示的时候转换为 UTF-8
if (mb_check_encoding($str,"GBK"))
$str = mb_convert_encoding($str,"UTF-8",“GBK”);

$str ="修改内容";
$str = mb_convert_encoding($str,$srcbm,"UTF-8"); //原样转回去
file_put_contents($file,$str);

@H_419_36@

脚本宝典总结

以上是脚本宝典为你收集整理的PHP 与 UTF-8 的最佳实践详细介绍全部内容,希望文章能够帮你解决PHP 与 UTF-8 的最佳实践详细介绍所遇到的问题。

如果觉得脚本宝典网站内容还不错,欢迎将脚本宝典推荐好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。
标签: