PHP正则表达式匹配验证提取网址URL实例总结_php

网址规则是可寻的，所以我们可以使用正则表达式来提取字符串中的url地址了，下面一起来看看小编整理的几个PHP正则表达式匹配验证提取网址URL实例.

匹配网址 URL 的正则表达式：

代码如下	复制代码
(((f\|ht){1}tp://)[-a-zA-Z0-9@:%_\+.~#?&//=]+)

示例：PHP 正则表达式自动匹配字符串是否为 url 地址，是的话自动加上链接。

代码如下

复制代码

<?php
function autolink($rurl){
   $rurl = eregi_replace('(((f|ht){1}tp://)[-a-zA-Z0-9@:%_
\+.~#?&//=]+)', '<a href="\1" target=_blank rel=nofollow>\1
</a>', $rurl);   // rel=nofollow 是告诉搜索引擎不要去抓取这个链接
   if( strpos($rurl "http") === FALSE ){
      $rurl = eregi_replace('(www.[-a-zA-Z0-9@:%_\+.~#?&//=]+
)', '<a href="http://\1" target=_blank rel=nofollow >\1</a>', $rurl);
      }else{
         $rurl = eregi_replace('([[:space:]()[{}])(www.[-a-zA-Z0-9@
:%_\+.~#?&//=]+)', '\1<a href="http://\2" target=_blank rel=nofol
low>\2</a>', $rurl);
   }
   return $rurl;
}
?>

调用 autolink() 函数

代码如下	复制代码
<?php $str = 'http://www.111cn.net'; echo autolink($str); ?>

例子1 获得https开头的例子

代码如下

复制代码

//https?://([-\w\.]+)+(:\d+)?(/([\w/_\.]*(\?\S+)?)?)?

//PHP Example: Automatically link URL's inside text.

$text = preg_replace('@(https?://([-\w\.]+)+(:\d+)?(/([\w/_\.]*(\?\S+)?)?)?)@', '<a href="$1">$1</a>', $text);

例子2 直接提取页面中<a 中的url地址

代码如下

复制代码

好了到此关于正则获得url地址也就介绍完了，上面的几个例子各有所长了，大家可以根据自己的需求来选择更合适自己的匹配验证提取网址URL正则。

数字正则比字母来看是相对来说比较容易的了，下文小编给各位整理了几段数字正则表达式了，有兴起的可以进入来看看。

例子，提取字符串中的数字

$str = ereg_replace('[^0-9]',",$str);和

$str = preg_replace( '/[^\d]/ ', ' ',$str);

数字正则过滤

if(preg_match("/^\d*$/",$yebihai))
echo('是数字');
else
echo('不是数字');

或者用函数

if(is_numeric($yebihai))
echo('是数字');
else
echo('不是数字');

下面验证数字一些正确

验证数字：^[0-9]*$
验证n位的数字：^\d{n}$
验证至少n位数字：^\d{n,}$
验证m-n位的数字：^\d{m,n}$
验证零和非零开头的数字：^(0|[1-9][0-9]*)$
验证有两位小数的正实数：^[0-9]+(.[0-9]{2})?$
验证有1-3位小数的正实数：^[0-9]+(.[0-9]{1,3})?$
验证非零的正整数：^\+?[1-9][0-9]*$
验证非零的负整数：^\-[1-9][0-9]*$
验证非负整数（正整数 + 0） ^\d+$
验证非正整数（负整数 + 0） ^((-\d+)|(0+))$

在正则表达式中(.*)和(.*?)有什么区别呢，小编看就去星号全部是代表所有字符了，那么后面的问号又是什么功能呢，下面一起来看看吧．

当正则表达式中包含重复量词(如：*,?,+)时，通常的行为是匹配尽可能多的字符，比如：a(.*)b去匹配aabab字符串，它会匹配整个字符串，这被称为贪婪匹配。

$str = 'aabab';
preg_match("/a(.*)b/", $str, $matches);
print_r($matches);

array([0]=>aabab [1]=>[aba])

有的时候我们需要懒惰匹配，也就是匹配尽可能少的字符，在量词后边加一个问号?，比如(.*?)在能使整个匹配成功的前提下使用最少的重复。

$str = 'aabab';
preg_match("/a(.*?)b/", $str, $matches);
print_r($matches);

array([0]=>aab [1]=>[a])

解析

?涉及到贪婪模式

当正则表达式中包含能接受重复的限定符时，通常的行为是（在使整个表达式能得到匹配的前提下）匹配尽可能多的字符。以这个表达式为例：a.*b，它将会匹配最长的以a开始，以b结束的字符串。如果用它来搜索aabab的话，它会匹配整个字符串aabab。这被称为贪婪匹配。

有时，我们更需要懒惰匹配，也就是匹配尽可能少的字符。前面给出的限定符都可以被转化为懒惰匹配模式，只要在它后面加上一个问号?。这样.*?就意味着匹配任意数量的重复，但是在能使整个匹配成功的前提下使用最少的重复。现在看看懒惰版的例子吧：

a.*?b匹配最短的，以a开始，以b结束的字符串。如果把它应用于aabab的话，它会匹配aab（第一到第三个字符）和ab（第四到第五个字符）

JGsoft RegexBuddy 是一款正则表达式工具。容易创建完全符合你的要求的正则表达式。清楚地理解其他人写的复杂的正则表达式。通过示例字符串和文件，快速测试任意正则表达式，防止在处理真实数据时发生错误。

RegexBuddy是一款正则表达式编辑工具，帮助你的编写需要的正则表达式，还可以使用它理解别人编写的表达式。RegexBuddy提供可视化的支持、提示、调试方面的便利;在使用正则表达式时，RegexBuddy将正则式转换为多种语言的字串，还提供了代码输出功能。

RegexBuddy是学习正则表达式时的比较好的帮手,它可以容易地建立你想要的正确的正则表达式。清晰地推断他人所写的复杂的正则表达式。它还可以用给出的实例字符串或文件快速地进行测试匹配，从而防止了在实际应用中出现错误。RegexBuddy会在你的源代码中根据你所应用的特殊编程语言，自动生成带有正则表达式的代码段。同时你也可以收集正则表达式到库中，以在未来重新使用。

比如我们在网页中抓取一段文本，比较凌乱，我们需要从中抓取需要下载的地址，简简单单几句就可以抓取到其中内容。

推荐：正则表达式编写神器 -- JGsoft RegexBuddy