首页 > 编程技术 > php

php正则表达匹配中文问题分析

发布时间:2016-11-25 17:39

本文章分析了在php中正则表达式对中文的支持问题,一般情况下我们可会能简单利用我上面的正则来验证中文,后面我分析了关于兼容gb2312,utf-8和表达式 ^[\\x7f-\\xff]+$ 可以完全搞定中文不兼容的问题。
 代码如下 复制代码

$str = '中华人民共和国123456789abcdefg';
echo preg_match("/^[u4e00-u9fa5_a-zA-Z0-9]{3,15}$",$strName);

运行一下上面这段代码,看会有什么提示信息?
 
Warning: preg_match(): Compilation failed: PCRE does not support L, l, N, P, p, U, u, or X at offset 3 in F:wwwrootphptest.php on line 2
原来,PHP正则表达式中不支持下列 Perl 转义序列:L, l, N, P, p, U, u, or X

在 UTF-8 模式下,允许用“x{...}”,花括号中的内容是表示十六进制数字的字符串。

原来的十六进制转义序列 xhh 如果其值大于 127 的话则匹配了一个双字节 UTF-8 字符。
所以,
可以这样来解决

 代码如下 复制代码

preg_match("/^[x80-xff_a-zA-Z0-9]{3,15}$",$strName);


preg_match('/[x{2460}-x{2468}]/u', $str);

匹配 内码汉字
按照他提供的方式进行测试,代码如下:

 代码如下 复制代码

$str = "php编程";
if (preg_match("/^[x{2460}-x{2468}]+$/u",$str)) {
print("该字符串全部是中文");
} else {
print("该字符串不全部是中文");
}

发现这次依然对是否为中文判断失常。不过,既然x表示的十六进制数据,为什么和js里边提供的范围x4e00-x9fa5不一样呢?于是我就换成了下边的代码:

 代码如下 复制代码
$str = "php编程";
if (preg_match("/^[x4e00-x9fa5]+$/u",$str)) {
print("该字符串全部是中文");
} else {
print("该字符串不全部是中文");
}

本来以为铁定成功了的事情,没想到,warning又一次产生了:
Warning: preg_match() [function.preg-match]: Compilation failed: invalid UTF-8 string at offset 6 in test.php on line 3

看来又有错误的表达方式了,于是对照了一下那篇文章的表达方式,给“4e00”和“9fa5”两边分别用"{"和“}”包起来,跑了一遍,发现真的准确了:

 代码如下 复制代码

$str = "php编程";
if (preg_match("/^[x{4e00}-x{9fa5}]+$/u",$str)) {
print("该字符串全部是中文");
} else {
print("该字符串不全部是中文");
}

知道了php中utf-8编码下用正则表达式匹配汉字的最终正确表达式——/^[x{4e00}-x{9fa5}]+$/u,

最后总结出

 代码如下 复制代码

//if (preg_match(“/^[".chr(0xa1)."-".chr(0xff)."]+$/”, $str)) { //只能在GB2312情况下使用
if (preg_match(“/^[x7f-xff]+$/”, $str)) { //兼容gb2312,utf-8
echo “正确输入”;
} else {
echo “错误输入”;
}

双字节字符编码范围

1. GBK (GB2312/GB18030)
x00-xff GBK双字节编码范围
x20-x7f ASCII
xa1-xff 中文 gb2312
x80-xff 中文 gbk

2. UTF-8 (Unicode)

u4e00-u9fa5 (中文)
x3130-x318F (韩文
xAC00-xD7A3 (韩文)
u0800-u4e00 (日文)

本文章收藏了关于PHP命令行模式提示”没有找到php_mbstring.dll,文件无法启动”多种解决办法,有需要的朋友可以参考一下。

解决方法:
在php.ini文件中将 extension=php_mbstring.dll 移动到 extension=php_exif.dll 之前即可.

原因就是exif要调用mbstring, 所以mbstring必须在前面.


php_exif.dll,EXIF 函数库,需要 php_mbstring.dll。

并且在 php.ini 中,php_exif.dll 必须在 php_mbstring.dll之后加载。


如果上面方法无效可参考方法二

没有找到php_mbstring.dll,文件无法启动,

解决方法:

在php.ini中默认的是extension_dir = "./"。然而扩展dll在ext目录下面,所以修改成extension_dir = "ext/"即可。

如果系统中没php_mbstring.dll文件可以下载

安装方法如下

把你的下载的php_mbstring.dll复制到

C:/Windows/System/System32
C:/Windows/System
C:/Windows

这里是系统目录哦,你安装在那个盘就是那个盘

本站创建文章转载注明来源 http://www.111cn.net/phper/php.html

今天我们利用了正则表达式来判断preg_replace替换由jquery转义过来的如\\u5c71\\u4e1c,但有的时间还是会出现中文问题,下面来看看解决办法
 代码如下 复制代码
<?php
$code = json_encode($str);
$code = preg_replace("#\u([0-9a-f]+)#ie", "iconv('UCS-2', 'UTF-8', pack('H4', '\1'))", $code);
?>
自己在做php时突然出现php Notice : Use of undefined constant这种错误,一个就是变量未定义出问题,下面我们来看看解决办法吧。

错误提示

php Notice : Use of undefined constant

分析

这些是 PHP 的提示而非报错,PHP 本身不需要事先声明变量即可直接使用,但是对未声明变量会有提示。一般作为正式的网站会把提示关掉的,甚至连错误信息也被关掉

解决办法

  关闭 PHP 提示的方法

  搜索php.ini:

  

 代码如下 复制代码

error_reporting = E_ALL

  改为:

  error_reporting = E_ALL & ~E_NOTICE

  还有个不是办法的办法就是

  在每个文件头上加

 

 代码如下 复制代码
 error_reporting(0); 虽然不好弄但是可以解决问题

外国参考文章


Hello,
You need to change your php.ini file

find the word "error_reporting" in your php.ini file and make the

change like below..

 代码如下 复制代码

error_reporting = E_ALL & ~E_NOTICE & ~E_STRICT


regards
R.Sureshkannan

文章介绍了三个输出函数echo和print和print_r区别,下面我们来一下介绍一下用法速度问题。

1.echo和print的区别

PHP中echo和print的功能基本相同(输出),但是两者之间还是有细微差别的。echo输出后没有返回值,但print有返回值,当其执行失败时返回flase。因此可以作为一个普通函数来使用,例如执行下面的代码后变量$r的值将为1。

$r = print "Hello World";

这意味着print可用在一些复杂的表达式中,而echo则不行。但是,因为echo语句不要求返回任何数值,所已在代码中echo语句的运行效率要略微快于print语句。


echo 没有返回值;print 有返回值,print 的返回值总是1。

表达式
print 可以用于复杂的表达式,而 echo 不可以。比如 print 可以用于如下示例:

 代码如下 复制代码
<html><body><?php$a=true;$a ? print "true":print "false";?></body></html>

参数
echo 可以有多个参数,而 print 只能有一个参数。

echo 如果有多个参数,应用逗号分隔,每个参数没有必要加小括号,正确写法如下:

 代码如下 复制代码
echo "good ","for ","you";

注意,如果 echo 有多个参数,只用一个小括号将所有参数围起来,是错误的写法。下面的写法是错误的:

 代码如下 复制代码
echo ("good ","for ","you");

print 只能有一个参数,比如:

 代码如下 复制代码

print ("good for you");
print "good for you";

echo 和 print 的作用都是输出字符串。echo 和 print 之间主要的区别在于,echo 的速度比 print 快,因为 echo 没有返回值。


print_r()函数 ,只用于输出数组。

php 中 print_r 函数输出的数组内容不排列。为了让它输出的好看些。如,数组有多层。分段列出,我们可以这样写:

Example #1 print_r() example

 代码如下 复制代码

<pre>
<?php
$a = array ('a' => 'apple', 'b' => 'banana', 'c' => array ('x', 'y', 'z'));
print_r ($a);
?>
</pre>
The above example will output:

<pre>
Array
(
    [a] => apple
    [b] => banana
    [c] => Array
        (
            [0] => x
            [1] => y
            [2] => z
        )
)
</pre>

标签:[!--infotagslink--]

您可能感兴趣的文章: