首页 > 编程技术 > php

php用正则判断是否为中文例子

发布时间:2016-11-25 17:41

php用正则判断是否为中文我们不能使用简单的一个例子来进行判断了需要通过一些编码与字符区间来进行验证了,具体的如下所示。

php用preg_match来匹配并判断一个字符串中是否含有中文或者都是中文的方法如下:

$str = 'php学习博客';
if(preg_match('/[\x7f-\xff]/', $str)){
  echo '字符串中有中文<br/>';
}else{
  echo '字符串中没有中文<br/>';
}

if(preg_match('/^[\x7f-\xff]+$/', $str)){
  echo '字符串全是中文';
}else{
  echo '字符串不全是中文';
}

以上程序的输出的结果为:
字符串中有中文
字符串不全是中文

utf-8和gbk编码下都进行了一番测试,均可以使用。

补充:

$str="aaa";
if(!eregi("[^\x80-\xff]","$str"))
{
echo "是";
}
else
{
echo "不是";
}
?>

";

//if (preg_match("/^[".chr(0xa1)."-".chr(0xff)."]+$/", $str)) { //只能在GB2312情况下使用
if (preg_match("/^[\x7f-\xff]+$/", $str)) { //兼容gb2312,utf-8
echo "正确输入";
} else {
echo "错误输入";
}
?>


如果想判断一个字符串内是否有含有中文,请用下面的代码:

if (preg_match("/[\x7f-\xff]/", $string)) {
echo "有中文";
}else{
echo "没有中文";
}
判断中文和编码有关 gbk是双字节,utf8是三字节,可以根据中文的范围来判断  
 
编码范围1. GBK (GB2312/GB18030)  
\x00-\xff GBK双字节编码范围  
\x20-\x7f ASCII  
\xa1-\xff 中文  
\x80-\xff 中文 
 
2. UTF-8 (Unicode)  
\u4e00-\u9fa5 (中文)  
\x3130-\x318F (韩文  
\xAC00-\xD7A3 (韩文)  
\u0800-\u4e00 (日文)  
ps: 韩文是大于[\u9fa5]的字符  
正则例子:  
preg_replace(”/([\x80-\xff])/”,”",$str); 
preg_replace(”/([u4e00-u9fa5])/”,”",$str);  

正则表达式我就不说是什么意思了在php中正则表达式函数是有许多了有些已经不能用了有些非常的实用,有此只能匹配一个,有的可以匹配所有的,具体的我们来看看这些函数吧。

今天深入的把正则表达式看了一下,总结一下php的正则表达式所使用的函数

preg_match();
preg_match_all();
preg_replace();
preg_filter();
preg_grep();
preg_split();
preg_quote();

基本有这么多吧。

一个个来

先给大家介绍一个 在线 验证 正则表达式的工具

http://regexpal.isbadguy.com/

打开你就明白怎吗用了,我们先来说

preg_match() 函数用于进行正则表达式匹配,成功返回 1 ,否则返回 0 。

这个很简单直接来个例子就明白了

$subject = "abcdef";
$pattern = '/^def/';
preg_match($pattern, $subject, $matches, PREG_OFFSET_CAPTURE, 3);
print_r($matches);
preg_match_all() 函数用于进行正则表达式全局匹配,成功返回整个模式匹配的次数(可能为零),如果出错返回 FALSE 。

preg_match_all("|<[^>]+>(.*)</[^>]+>|U",
    "<b>example: </b><div align=left>this is a test</div>",
    $out, PREG_PATTERN_ORDER);
echo $out[0][0] . ", " . $out[0][1] . "\n";
echo $out[1][0] . ", " . $out[1][1] . "\n";

我们来重点讲讲

preg_replace();

preg_filter();

这两个函数的区别

$subject = array('1', 'a', '2', 'b', '3', 'A', 'B', '4');
$pattern = array('/d/', '/[a-z]/', '/[1a]/');
$replace = array('A:$0', 'B:$0', 'C:$0');
echo "preg_filter returns ";
print_r(preg_filter($pattern, $replace, $subject));
echo "preg_replace returns ";
print_r(preg_replace($pattern, $replace, $subject));

很明显我们可以看一下结果

preg_filter returns Array
(
    [0] => C:1
    [1] => B:C:a
    [3] => B:b
)
preg_replace returns Array
(
    [0] => C:1
    [1] => B:C:a
    [2] => 2
    [3] => B:b
    [4] => 3
    [5] => A
    [6] => B
    [7] => 4
)
这样就很明显了,preg_filter不会保留不匹配的选项,而preg_replace会保留不匹配的选项

preg_grep — 返回匹配模式的数组条目

$array = array("23.32","22","12.009","23.43.43");
print_r(preg_grep("/^(\d+)?\.\d+\.\d+$/",$array));

preg_split — 通过一个正则表达式分隔字符串

这个函数要提得一点是,explode()可以算是这个函数的一个子集

preg_quote — 转义正则表达式字符

最后这个函数就没什么好讲的了。就是不让执行正则表达式,转义一下字符,和自己手动加\转移是一样的

邮箱验证使用正则是非常的简单了,我们这里整理了两种PHP用户注册邮箱验证正则表达式方法例子,希望此文章能够让各位有帮助.
这里可以使用到2种方法,一种是用preg_match进行验证,一种是用JS判断。

 

第一、PHP方法

 

 代码如下 复制代码

preg_match("/^[0-9a-zA-Z]+@(([0-9a-zA-Z]+)[.])+[a-z]{2,4}$/i",$email );

 

使用方法:

 

 代码如下 复制代码

<?php
function isEmail($email){
if(preg_match("/^[0-9a-zA-Z]+@(([0-9a-zA-Z]+)[.])+[a-z]{2,4}$/i",$email )){
return '是邮箱';
     else{
return '不是邮箱';
}
}
?>

 

或者直接用IF判断:

 

 代码如下 复制代码

if(!preg_match("/^[0-9a-zA-Z]+@(([0-9a-zA-Z]+)[.])+[a-z]{2,4}$/i",$email )){
exit('错误:电子邮箱格式错误。<a href="javascript:history.back(-1);">返回</a>');
}

 

第二、JS判断方法

 

myreg = /^([a-zA-Z0-9]+[_|\_|\.]?)*[a-zA-Z0-9]+@([a-zA-Z0-9]+[_|\_|\.]?)*[a-zA-Z0-9]+\.[a-zA-Z]{2,4}$/;

 

使用方法:

 

 代码如下 复制代码

<script type="text/javascript">

function isEmail(val){

var myreg = /^([a-zA-Z0-9]+[_|\_|\.]?)*[a-zA-Z0-9]+@([a-zA-Z0-9]+[_|\_|\.]?)*[a-zA-Z0-9]+\.[a-zA-Z]{2,4}$/;

if(!myreg.test(val))

return '不是邮箱';

return '是邮箱';

};

alert( isEmail('i@julying.com') );

</script>

 

以上PHP和JS两种方法,根据我们实际的需要和项目使用,老蒋这里用了第一种方法。
正则匹配可能通过一些通配符来获得有规则的数据了,我们下文来为各位介绍一个php正则匹配字符串中js文件例子,具体的例子如下图所示。

将一个网页里面所有引入的js文件都匹配出来,在php中用正则表达式来实现,方式如下:

<?php
 header("Content-type:text/html;charset=utf-8");
 //匹配一个网页中引入的js文件
 $pageContent = file_get_contents('http://www.daixiaorui.com/cat_2.html');
 preg_match_all('/<script.*?src\s*=\s*[\"|\'](.*?)[\"|\'].*?>\s*?<\/script>/i', $pageContent, $js);
 print_r($js);

php正则匹配页面引入的js


其中“src\s*=\s*”表示可以是“src=”也可以是“src = ”这样的;“[\"|\']”表示路径可以是单引号,也可以为双引号;“.*?”尽可能的少重复,匹配最近的位置。

标签:[!--infotagslink--]

您可能感兴趣的文章: