php – mb_detect_encoding将ASCII检测为UTF-8?

发布时间:2022-04-30 发布网站:脚本宝典
脚本宝典收集整理的这篇文章主要介绍了php – mb_detect_encoding将ASCII检测为UTF-8?脚本宝典觉得挺不错的,现在分享给大家,也给大家做个参考。
我正在尝试自动将导入的IPTC元数据从图像转换为UTF-8,以便基于 PHP mb_函数存储在数据库中.

目前它看起来像这样:

$val = mb_convert_encoding($val,'UTF-8',mb_detect_encoding($val));

但是,当mb_detect_encoding()提供ASCII字符串(来自192-255的latin1字段中的特殊字符)时,它会将其检测为UTF-8,因此在以下尝试将所有内容转换为正确的UTF-8时,将删除所有特殊字符.

我尝试通过查找latin1值来编写自己的方法,如果没有发生,我会继续让mb_detect_encoding决定它是什么.但是当我意识到我不能确定其他编码不会对其他东西使用相同的字节值时,我中途停止了.

那么,有没有办法正确检测ASCII以作为编码提供给mb_convert_encoding?

指定首先检测ASCII的自定义顺序有效.
mb_detect_encoding($val,'ASCII,UTF-8,ISO-8859-15');

为完整起见,可用编码列表为http://www.php.net/manual/en/mbstring.supported-encodings.php

脚本宝典总结

以上是脚本宝典为你收集整理的php – mb_detect_encoding将ASCII检测为UTF-8?全部内容,希望文章能够帮你解决php – mb_detect_encoding将ASCII检测为UTF-8?所遇到的问题。

如果觉得脚本宝典网站内容还不错,欢迎将脚本宝典推荐好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。