正则表达式 |
<(\S*?) [^>]*>.*?</\1>|<.*? />
|
---|---|
匹配 | <html>hello</html>|<a>abcd</a> |
不匹配 | abc|123|<html>ddd |
正则表达式 |
^[^<>`~!/@\#}$%:;)(_^{&*=|'+]+$
|
---|---|
匹配 | This is a test |
不匹配 | <href = | <br> | That's it |
正则表达式 |
<!--.*?-->
|
---|---|
匹配 | <!-- <h1>this text has been removed</h1> --> | <!-- yada --> |
不匹配 | <h1>this text has not been removed</h1> |
正则表达式 |
(\[(\w+)\s*(([\w]*)=('|")?([a-zA-Z0-9|:|\/|=|-|.|\?|&]*)(\5)?)*\])([a-zA-Z0-9|:|\/|=|-|.|\?|&|\s]+)(\[\/\2\])
|
---|---|
匹配 | [link url="http://www.domain.com/file.extension?getvar=value&secondvar=value"]Link[/li |
不匹配 | [a]whatever[/b] | [a var1=something var2=somethingelse]whatever[/a] | [a]whatever[a] |
正则表达式 |
href=[\"\'](http:\/\/|\.\/|\/)?\w+(\.\w+)*(\/\w+(\.\w+)?)*(\/|\?\w*=\w*(&\w*=\w*)*)?[\"\']
|
---|---|
匹配 | href="www.yahoo.com" | href="http://localhost/blah/" | href="eek" |
不匹配 | href="" | href=eek | href="bad example" |
正则表达式 |
"([^"](?:\\.|[^\\"]*)*)"
|
---|---|
匹配 | "This is a \"string\"." |
不匹配 | "This is a \"string\". |
正则表达式 |
(?i:on(blur|c(hange|lick)|dblclick|focus|keypress|(key|mouse)(down|up)|(un)?load|mouse(move|o(ut|ver))|reset|s(elect|ubmit)))
|
||
---|---|---|---|
匹配 |
|
||
不匹配 | click | onandon | mickeymouse |
正则表达式 |
(?s)/\*.*\*/
|
---|---|
匹配 | /* .................... */ | /* imagine lots of lines here */ |
不匹配 | */ malformed opening tag */ | /* malformed closing tag /* |
正则表达式 |
<(\S*?) [^>]*>.*?</\1>|<.*? />
|
---|---|
匹配 | <html>hello</html>|<a>abcd</a> |
不匹配 | abc|123|<html>ddd |
正则表达式 |
\xA9
|
---|---|
匹配 | © |
不匹配 | anything |
正则表达式 |
src[^>]*[^/].(?:jpg|bmp|gif)(?:\"|\')
|
---|---|
匹配 | src="../images/image.jpg" | src="http://domain.com/images/image.jpg" | src='d:\w |
不匹配 | src="../images/image.tif" | src="cid:value" |
正则表达式 |
/\*[\d\D]*?\*/
|
---|---|
匹配 | /* my comment */ | /* my multiline comment */ | /* my nested comment */ |
不匹配 | */ anything here /* | anything between 2 seperate comments | \* *\ |
正则表达式 |
<[a-zA-Z]+(\s+[a-zA-Z]+\s*=\s*("([^"]*)"|'([^']*)'))*\s*/>
|
---|---|
匹配 | <img" width=100% src="test.gif"/> |
不匹配 | <img" width=100% src="test.gif"> | <img" width=100% src="test.gif"a/> |
例子
代码如下 | 复制代码 |
$preg = "/<[img|IMG].*?src=[\'|\"](.*?(?:[\.gif|\.jpg]))[\'|\"].*?[\/]?>/i"; preg_match_all($preg,$str,$res); |
这下子,管用多了,不管怎样的代码结构,都能顺利的匹配出图片的路径。
例子
代码如下 | 复制代码 |
$str='<p style="padding: 0px; margin-top: 0px; margin-bottom: 0px; line-height: 200%;"><img border="0"" width=100% src="upfiles/2009/07/1246430143_4.jpg" alt=""/></p><p style="padding: 0px; margin-top: 0px; margin-bottom: 0px; line-height: 200%;"><img border="0"" width=100% src="upfiles/2009/07/1246430143_3.jpg" alt=""/></p><p style="padding: 0px; margin-top: 0px; margin-bottom: 0px; line-height: 200%;"><img border="0"" width=100% src="upfiles/2009/07/1246430143_1.jpg" alt=""/></p>'; |
最后总结一个下载远程图片地址
代码如下 | 复制代码 |
/** |
方法一
代码如下 | 复制代码 |
$a ='<a href="www.111cn.net">百度</a>谷哥<a href="www.111cn.net">谷歌</a><a href="www.111cn.net">雅虎</a>'; 得出结果 Array ( [0] => Array ( [0] => <a href="www.111cn.net">百度</a> [1] => <a href="www.111cn.net">谷歌</a> [2] => <a href="www.111cn.net">雅虎</a> )
) |
方法二
示例如下:
代码如下 | 复制代码 |
$str1 = '<a href=http://www.111cn.net>test</a>'; $str2 = '<a href='http://www.111cn.net'>test</a>'; $str3 = '<a href = "javasccript: href ('test');" target = "_blank" />test</a>'; $regex = '/hrefs*=s*(?:"([^"]*)"|'([^']*)'|([^"'>s]+))/'; preg_match($regex, $str1, $matches); print_r($matches); preg_match($regex, $str2, $matches); print_r($matches); preg_match($regex, $str3, $matches); print_r($matches); 匹配结果: Array ( [0] => href=http://www.111cn.net [1] => [2] => [3] => http://www.111cn.net ) Array ( [0] => href='http://www.111cn.net' [1] => [2] => http://www.111cn.net ) Array ( [0] => href = "javasccript: href ('test');" [1] => javasccript: href ('test'); ) |
/href\s*=\s*(?:"([^"]*)"|\'([^\']*)\'|([^"\'>\s]+))/
思路很巧妙,即:
分两步,先区配a标签,然后再区配a标签里面的链接
采用php的正则删除中文
代码如下 | 复制代码 |
/*转换为UTF8 再处理*/ $a = mb_convert_encoding($a, 'UTF-8', 'GB2312'); $a = mb_convert_encoding($a, 'GB2312', 'UTF-8'); |
例子
代码如下 | 复制代码 |
|
简单说明下
x{4e00}-x{9fff} 这个是中文区间(各种文字都有unicode码区间)
/u 表示采用unicode码 进行正则判断
[] 正则标准括号,表示范围[0-3]表示 0,1,2,3, 0到3的意思
一般情况下用户名我们只能使用数字字母之类的但有时可能可以有中文,数字之类的,下面本文章总结了一些利用正则来验证用户名的例子。例子,字母、数字和汉字
代码如下 | 复制代码 |
if(preg_match("/[ '.,:;*?~`!@#$%^&+=)(<>{}]|]|[|/|\|"||/",$user)){ |
例子,全字母
代码如下 | 复制代码 |
<?php if (mb_ereg("^[w-.]{1,32}$", $str)) { ?> |
附一些常用正则
只能以数字或字母开头和结尾 用户名长度为4~18个字符
代码如下 | 复制代码 |
^[a-za-z0-9]{1}[a-za-z0-9|-|_]{2-16}[a-za-z0-9]{1}$ |
用户名为大写字母小写字母或下划线,并以字母开头,长度为6-20
代码如下 | 复制代码 |
^[a-za-z][wd_]{5,19} |
用户名:包括英文小写、汉字、数字、下划线,不能全部是数字,下划线不能在末尾
代码如下 | 复制代码 |
/^[a-z0-9_u4e00-u9fa5]+[^_]$/g utf-8下 preg_match("/^[a-z0-9_x80-xff]+[^_]$/g",$a); gbk下: preg_match("/^[a-z0-9_".chr(0xa1)."-".chr(0xff)."]+[^_]$/",$a) |
可有中文的用户名验证
代码如下 | 复制代码 |
[a-za-z0-9][u4e00-u9fa5] |