正则字母与数字是php正则表达式中最为简单也是常用的一个功能了,如果是单数字我们只要判断intval就可以了,如果是单字母也可以简单的W就可以判断了,但是组合的话有一点不一样,下面我们一起来学习一下吧。
数字正则过滤
代码如下 |
复制代码 |
if(preg_match("/^\d*$/",$yebihai))
echo('是数字');
else
echo('不是数字');
或者用函数
if(is_numeric($yebihai))
echo('是数字');
else
echo('不是数字');
|
这两种方法的区别是 is_numeric小数也会认为是数字,而前面正则会把小数点当作字符。
正则表达式如下 数字和字母 :
代码如下 |
复制代码 |
$password='abc12';
if(!preg_match("/^(([a-z]+[0-9]+)|([0-9]+[a-z]+))[a-z0-9]*$/i",$password)){
echo '密码必须由数字和字母的组合而成';
}
|
如果要限制长度6-15位的英文字符和数字
只要加个strlen来进行判断就可以了 如下$plen<6||$plen>15
代码如下 |
复制代码 |
$password='abc123';
$plen=strlen($password);
if(!preg_match("/^(([a-z]+[0-9]+)|([0-9]+[a-z]+))[a-z0-9]*$/i",$password)||$plen<6||$plen>15){
echo '密码必须为6-15位的数字和字母的组合';
}
|
其实我们还可以直接使用正则来限制长度
关于长度我们可参考一下规则.
验证n位的数字:^\d{n}$
验证至少n位数字:^\d{n,}$
验证m-n位的数字:^\d{m,n}$
上面是数字了,我们组合验证也只要在后面加一个{}就可以了。
代码如下 |
复制代码 |
$password='abc123';
$plen=strlen($password);
if(!preg_match("/^(([a-z]+[0-9]+)|([0-9]+[a-z]+))[a-z0-9]*{8,}$/i",$password)||$plen<6||$plen>15){
echo '密码必须为8位的数字和字母的组合';
}
|
//长度是8或更多 其实就是在正则后面加了一句{8,}就可以了,
在php中正则数字只要带D就可匹配出来了,下面我来做几个例子,用来检测字符串中数字然后提取出来,有需要的朋友可进入参考。
今天开发采集器,用到从字符串里取数字,后来想到了以下用正则表达式来取。
用正则
代码如下 |
复制代码 |
$str = ereg_replace(‘[^0-9]‘,”,$str);和
$str = preg_replace( ‘/[^\d]/ ‘, ‘ ‘,$str);
|
例子
代码如下 |
复制代码 |
function findNum($str=''){
$str=trim($str);
if(empty($str)){return '';}
$reg='/(\d{3}(\.\d+)?)/is';//匹配数字的正则表达式
preg_match_all($reg,$str,$result);
if(is_array($result)&&!empty($result)&&!empty($result[1])&&!empty($result[1][0])){
return $result[1][0];
}
return '';
}
|
如果是小数点呢,我们上面办法显然是不正确的,我们可以进行修改
代码如下 |
复制代码 |
$regexp = '/(\d+)\.(\d+)/is';
<?php
$total = "42.234 EUR 53.218 AUD CAD97.164 311.151 MYR 125.042 NZD GBP84.270 SGD60.227 USD134.400";
preg_match_all('/(\d+)\.(\d+)/is', $total, $arr);
var_export($arr);
?>
|
结果是我们相要的哦,不信你去试一下吧。
对于很多同学和我一样觉得匹配所有字符串我们可能使用.*来获取了,但是测试发现如果在一行没有问题,如果有换行就不行了,那么要如何处理。
对正则我是一知半解,我对正则的理念就是,能用就行!
对于所有字符,我一开始的理解就是 .*
后来GOOGLE了一下,才知道.*连在一起就意味着任意数量的不包含换行的字符。
所以可以使用 [\s\S]* 它的意思是任意空白字符和非空白字符。同理,也可以用 “[\d\D]*”、“[\w\W]*” 来表示。 d和D,w和W,s和S都是反义,加起来就是全部字符了。
注意:写在文本中的n是不会自动视为换行符的,测试$_="asdfnasdf";s/./-/;print;即可明白
补充
匹配中文字符的正则表达式: [\u4e00-\u9fa5]
匹配双字节字符(包括汉字在内):[^\x00-\xff]
匹配空行的正则表达式:\n[\s| ]*\r
匹配HTML标记的正则表达式:/<(.*)>.*<\/\1>|<(.*) \/>/
匹配首尾空格的正则表达式:(^\s*)|(\s*$)
php利用preg_match_all()正则获取字符串中指定参数链接地址很简单的,我们只要配合正则规则就可以实现了我们想要的结果了,下面看一个例子,非常的简单。
程序代码
<?php
$html = <<<HTML
<a href="http://www.111cn.net /?source=2008hao123banner">a1</a>
<a href="http://www.111cn.net /?source=2009hao123banner">a2</a>
HTML;
// echo $html;
$m = array();
preg_match_all("|<a href=\"http://www.111cn.net /\?source=(\d+)hao123banner\">(.*?)</a>|",$html,$m);
print_r($m);
运行结果
Array
(
[0] => Array
(
[0] => <a href="http://www.111cn.net /?source=2008hao123banner">a1</a>
[1] => <a href="http://www.111cn.net /?source=2009hao123banner">a2</a>
)
[1] => Array
(
[0] => 2008
[1] => 2009
)
[2] => Array
(
[0] => a1
[1] => a2
)
)
正则提取页面指定内容非常的简单我们可以通过preg_match执行正则表达式来实现了,下面整理了一些例子,希望对各位朋友会带来帮助哦。
例子代码如下,可常用于采集哦、
代码如下 |
复制代码 |
1、获取页面标题
//提取标题
preg_match('/<title>(?<title>.*?)<\/title>/i', $html, $titleArr);
$title = $titleArr['title'];
2、获取body主体内容,并将背景图片提取出来替换成其他图片地址
/**
* 获取BODY主体区域内容
* @param $html
* @param $urlRoot
* @return mixed
*/
function getBody($html,$urlRoot = null){
//提取BODY主体
preg_match('/<!--body-->(.*?)<!--body-->/is ', $html, $bodyArr);
if(!$bodyArr){
preg_match('/<body.*?>(.*?)<\/body>/is ', $html, $bodyArr);
}
$body = $bodyArr[1];
//替换img文件
$body = preg_replace('/(<[img|IMG].*src=[\'|"])(\.\.\/)*(img.[^\'||^"]+)/',"$1$urlRoot$3",$body);
//替换html文件内的css背景图片
$body = preg_replace('~\b(background(-image)?\s*:(.*?)\(\s*[\'|"]?)(\.\.\/)*(img.*?)?\s*\)~i',"$1$urlRoot$5)",$body);
return $body;
}
3、提取页面Description内容
function getDescription($html){
// Get the 'content' attribute value in a <meta name="description" ... />
$matches = array();
// Search for <meta name="description" content="Buy my stuff" />
preg_match('/<meta.*?name=("|\')description("|\').*?content=("|\')(.*?)("|\')/i', $html, $matches);
if (count($matches) > 4) {
return trim($matches[4]);
}
// Order of attributes could be swapped around: <meta content="Buy my stuff" name="description" />
preg_match('/<meta.*?content=("|\')(.*?)("|\').*?name=("|\')description("|\')/i', $html, $matches);
if (count($matches) > 2) {
return trim($matches[2]);
}
// No match
return null;
}
4、替换css文件的背景图片地址
/**
* 获取CSS内容
* @param $cssCnt
* @param $urlRoot
* @return mixed
*/
function getCss($cssCnt,$urlRoot =null){
//匹配包含 img文件夹的相对路径图片 (含义绝对路径的不包含在其中)
//匹配替换不一定准确,因为只是将 含义 ../ 的地址转为url 而没有考虑 ../../ 之类的层级关系
$css = preg_replace('~\b(background(-image)?\s*:(.*?)\(\s*[\'|"]?)(\.\.\/)*(img.*?)?\s*\)~i',"$1$urlRoot$5)",$cssCnt);
//添加css前缀
$css = preg_replace('/\b.(.*?)[,|{]/',"pat .$0",$cssCnt);
//TODO 压缩css
return $css;
}
|
从上面例子来看其实都是非常的简单就是批有规律的标签为开始与结束节点,这样我们可以获取这两个字符之类的内容也就是我们要提取的内容了哦,只是在中间有字符或空格的一些处理了哦。
标签:[!--infotagslink--]