php获取字符串中图片url地址正则_php

自己写了一个匹配图片路径的正则，总是有点不兼容，有些图片的路径获取不到，在网上找了半天，总算找到一个完美的。

例子

代码如下

复制代码

$preg = "/<[img|IMG].*?src=[\'|\"](.*?(?:[\.gif|\.jpg]))[\'|\"].*?[\/]?>/i";

preg_match_all($preg,$str,$res);

这下子，管用多了，不管怎样的代码结构，都能顺利的匹配出图片的路径。
例子

代码如下

复制代码

$str='<img border="0"" width=100% src="upfiles/2009/07/1246430143_4.jpg" alt=""/><img border="0"" width=100% src="upfiles/2009/07/1246430143_3.jpg" alt=""/><img border="0"" width=100% src="upfiles/2009/07/1246430143_1.jpg" alt=""/>';

$pattern="/<[img|IMG].*?src=[\'|\"](.*?(?:[\.gif|\.jpg]))[\'|\"].*?[\/]?>/";

preg_match_all($pattern,$str,$match);

print_r($match);

最后总结一个下载远程图片地址

代码如下	复制代码
/** * 提取字符串中图片url地址 * @param type $str * @return type / function getimgs($str) { $reg = '/((http\|https):\/\/)+(\w+\.)+(\w+)[\w\/\.\-](jpg\|gif\|png)/'; $matches = array(); preg_match_all($reg, $str, $matches); foreach ($matches[0] as $value) { $data[] = get_file($value); } return $data; }

下面来给大家分享一个正则神器 VerbalExpressionsPhp使用例子,有兴趣的同学不防进入参考一下吧。

该类库是jehna/VerbalExpressions的php版本。

这货的竟然通过链式方法把正则给语义化了。。。我表示很愤慨啊。。。

安装

代码如下

复制代码

加入composer.json

{
    "require": {
        ...,
        "markwilson/VerbalExpressionsPhp": "dev-master"
    }
}

使用

代码如下

复制代码

<?php

require_once 'vendor/autoload.php';

use MarkWilson＼VerbalExpression;
use MarkWilson＼VerbalExpression＼Matcher;

// 初始化VerbalExpression实例
$verbalExpression = new VerbalExpression();

// URL地址匹配
$verbalExpression->startOfLine()
 ->then('http')
 ->maybe('s')
 ->then('://')
 ->maybe('www.')
 ->anythingBut(' ')
 ->endOfLine();

// 编译表达式 - 返回： ^(http)(s)?(＼:＼/＼/)(www＼.)?([^＼ ]*)$
$verbalExpression->compile();

// 执行匹配
preg_match($verbalExpression, 'http://www.111cn.net'); // 返回 1
// 或
$matcher = new Matcher();
$matcher->isMatch($verbalExpression, 'http://www.google.com'); // 返回 true

嵌套表达式

代码如下	复制代码
<?php $innerExpression = new VerbalExpression(); $innerExpression->word(); $outerExpression = new VerbalExpression(); $outerExpression->startOfLine() ->find($innerExpression) ->then($innerExpression) ->endOfLine(); // 返回 ^(＼w+)(＼w+)$ $outerExpression->compile();

禁用子模式捕获

默认情况下，子匹配规则可以被获取，并返回匹配的数组。

代码如下	复制代码
<?php // 禁用获取子匹配规则 $verbalExpression->disableSubPatternCapture()->word(); // (?:＼w+) // 或 $verbalExpression->word(false); // (?:＼w+)

这样做只会影响后续增加的表达式;任何已经添加的匹配规则不会受到影响。这里允许禁用和启用组。

代码如下	复制代码
<?php // 相当于 (＼w+)(?:＼w+)(?:＼w+)(＼w+) $verbalExpression->word() ->disableSubPatternCapture() ->word() ->word() ->enableSubPatternCapture() ->word();

下面整理的正则匹配html标签的例子都是在网上找了，不过这一篇是非常的全面的并且包括了html中各种标签了，具体有多少我不说我可以告诉你所有的html都可以匹配出来哦。

正则表达式	<(\S?) [^>]>.?</\1>\|<.? />
匹配	<html>hello</html>\|<a>abcd</a>
不匹配	abc\|123\|<html>ddd

正则表达式	^[^<>`~!/@\#}$%:;)(_^{&*=\|'+]+$
匹配	This is a test
不匹配	<href = \| <br> \| That's it

正则表达式	<!--.*?-->
匹配	<!-- <h1>this text has been removed</h1> --> \| <!-- yada -->
不匹配	<h1>this text has not been removed</h1>

正则表达式	(\[(\w+)\s(([\w])=('\|")?([a-zA-Z0-9\|:\|\/\|=\|-\|.\|\?\|&])(\5)?)\])([a-zA-Z0-9\|:\|\/\|=\|-\|.\|\?\|&\|\s]+)(\[\/\2\])
匹配	[link url="http://www.domain.com/file.extension?getvar=value&secondvar=value"]Link[/li
不匹配	[a]whatever[/b] \| [a var1=something var2=somethingelse]whatever[/a] \| [a]whatever[a]

正则表达式	href=[\"\'](http:\/\/\|\.\/\|\/)?\w+(\.\w+)(\/\w+(\.\w+)?)(\/\|\?\w=\w(&\w=\w)*)?[\"\']
匹配	href="www.yahoo.com" \| href="http://localhost/blah/" \| href="eek"
不匹配	href="" \| href=eek \| href="bad example"

正则表达式	"([^"](?:\\.\|[^\\"]))"
匹配	"This is a \"string\"."
不匹配	"This is a \"string\".

正则表达式

匹配

	onclick \| onsubmit \| onmouseover

不匹配

click | onandon | mickeymouse

正则表达式	(?s)/\.\*/
匹配	/* .................... / \| / imagine lots of lines here */
不匹配	/ malformed opening tag / \| /* malformed closing tag /*

正则表达式	<(\S?) [^>]>.?</\1>\|<.? />
匹配	<html>hello</html>\|<a>abcd</a>
不匹配	abc\|123\|<html>ddd

正则表达式	\xA9
匹配	©
不匹配	anything

正则表达式	src[^>]*[^/].(?:jpg\|bmp\|gif)(?:\"\|\')
匹配	src="../images/image.jpg" \| src="http://domain.com/images/image.jpg" \| src='d:\w
不匹配	src="../images/image.tif" \| src="cid:value"

正则表达式	/\[\d\D]?\*/
匹配	/* my comment / \| / my multiline comment / \| / my nested comment */
不匹配	/ anything here / \| anything between 2 seperate comments \| \* *\

正则表达式	<[a-zA-Z]+(\s+[a-zA-Z]+\s=\s("([^"])"\|'([^'])'))\s/>
匹配	<img" width=100% src="test.gif"/>
不匹配	<img" width=100% src="test.gif"> \| <img" width=100% src="test.gif"a/>

匹配html中A标签其实非常的简单我们只要懂一点正则的都可以实现，下面我整理了两个不同方法正则匹配A标签的例子。

方法一

代码如下

复制代码

$a ='<a href="www.111cn.net">百度</a>谷哥<a href="www.111cn.net">谷歌</a><a href="www.111cn.net">雅虎</a>';
preg_match_all('/<a[^>]+>[^>]+a>/',$a,$aout);
print_r($aout);

得出结果

Array

(

[0] => Array

(

[0] => <a href="www.111cn.net">百度</a>

[1] => <a href="www.111cn.net">谷歌</a>

[2] => <a href="www.111cn.net">雅虎</a>

)

方法二

示例如下：

代码如下

复制代码

$str1 = '<a href=http://www.111cn.net>test</a>';
$str2 = '<a href='http://www.111cn.net'>test</a>';
$str3 = '<a href = "javasccript: href ('test');" target = "_blank" />test</a>';
$regex = '/hrefs*=s*(?:"([^"]*)"|'([^']*)'|([^"'>s]+))/';
preg_match($regex, $str1, $matches);
print_r($matches);
preg_match($regex, $str2, $matches);
print_r($matches);
preg_match($regex, $str3, $matches);
print_r($matches);

匹配结果：
Array
(
 [0] => href=http://www.111cn.net
 [1] =>
 [2] =>
 [3] => http://www.111cn.net
)
Array
(
 [0] => href='http://www.111cn.net'
 [1] =>
 [2] => http://www.111cn.net
)
Array
(
 [0] => href = "javasccript: href ('test');"
 [1] => javasccript: href ('test');
)

/href\s*=\s*(?:"([^"]*)"|\'([^\']*)\'|([^"\'>\s]+))/
思路很巧妙，即：
分两步，先区配a标签，然后再区配a标签里面的链接

我做了一个英文站但是经常有人发中文的评论了，希望这些垃圾评论全部替换成字了，下面我整理了两个php正则替换中文的例子，我们一起来看看。

采用php的正则删除中文

代码如下

复制代码

/*转换为UTF8 再处理*/

$a = mb_convert_encoding($a, 'UTF-8', 'GB2312');
$a = preg_replace("/[x{4e00}-x{9fff}]/u", "", $a);

/*再转回来*

$a = mb_convert_encoding($a, 'GB2312', 'UTF-8');

例子

代码如下	复制代码
$chstr="<a>中文区间afeowahgieawhjo中文区间fawgwea中文区间aghoiawghowi中文区间</a>"; $match="/[中文区间\|中文区间\|我靠\|中文区间]/"; $chstr=preg_replace($match,"",$chstr); echo $chstr;

简单说明下

x{4e00}-x{9fff} 这个是中文区间（各种文字都有unicode码区间）

/u 表示采用unicode码进行正则判断

[] 正则标准括号，表示范围[0-3]表示 0，1，2，3， 0到3的意思

标签：[!--infotagslink--]

上一篇: php中preg_match的isU代表什么意义

下一篇: php正则判断只能输入字母字符和数字例子

php获取字符串中图片url地址正则

您可能感兴趣的文章: