代码如下 | 复制代码 |
function getpic($str){ |
utf-8环 境下中文的匹配
\w匹配的仅仅是中文,数字,字母,对于国人来讲,仅匹配中文时常会用到,见下
匹配中文字符的正则表达式: [\u4e00-\u9fa5]
或许你也需要匹配双字节字符,中文也是双字节的字符
匹配双字节字符(包括汉字在内):[^\x00-\xff]
注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)
在ANSI(gb2312)环 境下
匹配全部的gb2312编 码表的字符:/[".chr(0xb0)."-".chr(0xf7)."]+/
单纯匹配汉字而不匹配全角标点:/([".chr(0xb0)."-".chr(0xf7)."][".chr(0xa1)."-".chr(0xfe)."])/
该表达式能匹配一个中文字符。
匹配全角标点而不匹配汉字:/([".chr(0xa1)."-".chr(0xa3)."][".chr(0xa1)."-".chr(0xff)."])/
例子
代码如下 | 复制代码 |
1、使用preg_match函数匹配汉字 <?php <?php <?php <?php |
由结果可看出,使用[\x4e00-\x9fa5]这个正则表达式可以匹配到中文。
preg_match或者preg_match_all的不同的地方就是,前者匹配一次就完了(无论是否匹配成功),而后者,会从待匹配的字符串的开头到结尾匹配一遍。
今天开发采集器,用到从字符串里取数字,后来想到了以下用正则表达式来取。
用正则
代码如下 | 复制代码 |
$str = ereg_replace(‘[^0-9]‘,”,$str);和 $str = preg_replace( ‘/[^\d]/ ‘, ‘ ‘,$str); |
例子
代码如下 | 复制代码 |
function findNum($str=''){ |
如果是小数点呢,我们上面办法显然是不正确的,我们可以进行修改
代码如下 | 复制代码 |
$regexp = '/(\d+)\.(\d+)/is'; <?php ?> |
结果是我们相要的哦,不信你去试一下吧。
正则字母与数字是php正则表达式中最为简单也是常用的一个功能了,如果是单数字我们只要判断intval就可以了,如果是单字母也可以简单的W就可以判断了,但是组合的话有一点不一样,下面我们一起来学习一下吧。数字正则过滤
代码如下 | 复制代码 |
if(preg_match("/^\d*$/",$yebihai))
if(is_numeric($yebihai)) |
这两种方法的区别是 is_numeric小数也会认为是数字,而前面正则会把小数点当作字符。
正则表达式如下 数字和字母 :
代码如下 | 复制代码 |
$password='abc12'; |
如果要限制长度6-15位的英文字符和数字
只要加个strlen来进行判断就可以了 如下$plen<6||$plen>15
代码如下 | 复制代码 |
$password='abc123'; |
其实我们还可以直接使用正则来限制长度
关于长度我们可参考一下规则.
验证n位的数字:^\d{n}$
验证至少n位数字:^\d{n,}$
验证m-n位的数字:^\d{m,n}$
上面是数字了,我们组合验证也只要在后面加一个{}就可以了。
代码如下 | 复制代码 |
$password='abc123'; |
//长度是8或更多 其实就是在正则后面加了一句{8,}就可以了,
对于很多同学和我一样觉得匹配所有字符串我们可能使用.*来获取了,但是测试发现如果在一行没有问题,如果有换行就不行了,那么要如何处理。对正则我是一知半解,我对正则的理念就是,能用就行!
对于所有字符,我一开始的理解就是 .*
后来GOOGLE了一下,才知道.*连在一起就意味着任意数量的不包含换行的字符。
所以可以使用 [\s\S]* 它的意思是任意空白字符和非空白字符。同理,也可以用 “[\d\D]*”、“[\w\W]*” 来表示。 d和D,w和W,s和S都是反义,加起来就是全部字符了。
注意:写在文本中的n是不会自动视为换行符的,测试$_="asdfnasdf";s/./-/;print;即可明白
补充
匹配中文字符的正则表达式: [\u4e00-\u9fa5]
匹配双字节字符(包括汉字在内):[^\x00-\xff]
匹配空行的正则表达式:\n[\s| ]*\r
匹配HTML标记的正则表达式:/<(.*)>.*<\/\1>|<(.*) \/>/
匹配首尾空格的正则表达式:(^\s*)|(\s*$)