preg_replace比ereg_replace快多少？_php

preg_replace是Perl内置的一种文字匹配模式，不过用起来一些参数会比ereg_relace复杂一些，实际的项目运用中，用ereg的人还是不少，近日我写了一个获取HTML中的文本的函数，发现preg_replace居然比ereg_replace快了近一倍，两个函数如下：

用preg_replace

function GetHtmlText($str)
{
$str = preg_replace("/<sty(.*)/style>|<scr(.*)/script>|/isU","",$str);
$alltext = "";
$start = 1;
for($i=0;$i<strlen($str);$i ){
if($start==0 && $str[$i]==">") $start = 1;
else if($start==1){
if($str[$i]=="<"){ $start = 0; $alltext .= " "; }
else if(ord($str[$i])>32) $alltext .= $str[$i];
}
}
$alltext = preg_replace("/&([^;&]*)(;|&)/"," ",$alltext);
$alltext = preg_replace("/　{1,}/"," ",$alltext);
$alltext = preg_replace("/ {1,}/"," ",$alltext);
return $alltext;
}

用ereg_replace

function GetHtmlText($str)
{
$str = eregi_replace("<sty(.*)/style>|<scr(.*)/script>|","",$str);
$alltext = "";
$start = 1;
for($i=0;$i<strlen($str);$i ){
if($start==0 && $str[$i]==">") $start = 1;
else if($start==1){
if($str[$i]=="<"){ $start = 0; $alltext .= " "; }
else if(ord($str[$i])>32) $alltext .= $str[$i];
}
}
$alltext = ereg_replace("&([^;&]*)(;|&)"," ",$alltext);
$alltext = ereg_replace("　{1,}"," ",$alltext);
$alltext = ereg_replace(" {1,}"," ",$alltext);
return $alltext;
}

经过多次测试对比，用preg_replace的函数普遍在 0.08-0.12秒之间，用ereg_replace的函数却去到0.35-0.38秒之间，测试的网页为百度的主页，我的系统是图拉丁 1.1G的CPU，384M的内存。

假如你的程序中还有使用ereg处理较长文本的，建议马上更改过来。

我们手头的PHP资料不多，大家是不是都有一份php4gb.chm。我最欣赏它里面的函数库部分了，真正的在线帮助。但是PHP发展的脚步实在太快了，你睢，我最近在www.php.net/manual/　又找到了一些扩展的数组函数。

下面我把它们介绍给大家吧，我的英文水平不高，有译的不对的地方，请指正。
格式是这样的：

函数名支持版本

函数声明
说明及参数、返回值

例子

OK，Let's go.

//*************************
array_flip (PHP4 >= 4.0b4)

array array_flip (array trans)

将数组trans的key、value交换，就是key变value，而value变key了。
返回完成处理的数组。

例：
$a[0]="abc";
$a[1]="def";
After an array_flip() you get:
$a["abc"]=0; $a["def"]=1;

//***************************
array_count_values (PHP4 >= 4.0b4)

array array_count_values (array input)
统计input数组中各个值的个数。返回一个数组，以input的值做为key，以出现个数为value的新数组。

例：
$array = array (1, "hello", 1, "world", "hello");
array_count_values ($array);
// returns array (1=>2, "hello"=>2, "world"=>1)

//*****************************
array_merge (PHP4 )

array array_merge (array array1, array array2 [, array ...])
合并多个数组，把array2的内容加在array1的后面。返回结果数组。
假如是关联数组，以字串为key，出现同名的key，则后面的会覆盖前面的，而下标数组不会出现覆盖的现象，只是添加在后面。

例：
$array1 = array ("color" => "red", 2, 4);
$array2 = array ("a", "b", "color" => "green", "shape" => "trapezoid", 4);
array_merge ($array1, $array2);
//Resulting array will be array("color" => "green", 2, 4, "a", "b", "shape" => "trapezoid", 4).

See also array_merge_recursive().

//******************************
array_merge_recursive (PHP4 >= 4.0.1)

array array_merge_recursive (array array1, array array2 [, array ...])
递归合并数组，与上个函数基本类似。区别在于，在关联数组方面，它不是简单地把相同的key合并，还是生成一个二维数组来合并这相同key的value。（表达不清，不好意思，看例子吧）。

例：
$ar1 = array ("color" => array ("favorite" => "red"), 5);
$ar2 = array (10, "color" => array ("favorite" => "green", "blue"));
$result = array_merge_recursive ($ar1, $ar2);

//Resulting array will be array ("color" => array ("favorite" => array ("red", "green"), "blue"), 5, 10).

明白了吗？red,green被合并成一个新的数组了，放在favorite里。

See also array_merge().

//*******************************
array_intersect (PHP4 >= 4.0.1)

array array_intersect (array array1, array array2 [, array ...])
取多个数组的交集，返回包含交集元素的新数组。
以array1为基础的，所以了，假如是关联数组，那key值就是array1的了。见例子。

<?php
class class_post
{
//验证是否为指定长度的字母/数字组合
function fun_text1($num1,$num2,$str)
{
Return (preg_match("/^[a-zA-Z0-9]{".$num1.",".$num2."}$/",$str))?true:false;
}

//验证是否为指定长度数字
function fun_text2($num1,$num2,$str)
{
return (preg_match("/^[0-9]{".$num1.",".$num2."}$/i",$str))?true:false;
}
//验证是否为指定长度汉字
function fun_font($num1,$num2,$str)
{
// preg_match("/^[xa0-xff]{1,4}$/", $string);
return (preg_match("/^([x81-xfe][x40-xfe]){".$num1.",".$num2."}$/",$str))?true:false;
}
//验证身份证号码
function fun_status($str)
{
return (preg_match('/(^([d]{15}|[d]{18}|[d]{17}x)$)/',$str))?true:false;
}

//验证邮件地址
function fun_email($str){
return (preg_match('/^[_.0-9a-z-] @([0-9a-z][0-9a-z-] .) [a-z]{2,4}$/',$str))?true:false;
}
//验证电话号码
function fun_phone($str)
{
return (preg_match("/^(((d{3}))|(d{3}-))?((0d{2,3})|0d{2,3}-)?[1-9]d{6,7}$/",$str))?true:false;
}
//验证邮编
function fun_zip($str)
{
return (preg_match("/^[1-9]d{5}$/",$str))?true:false;
}
//验证url地址
function fun_url($str)
{
return (preg_match("/^http://[A-Za-z0-9] .[A-Za-z0-9] [/=?%-&_~`@[]': !]*([^<>""])*$/",$str))?true:false;
}

// 数据入库转义非凡字符传入值可为字符串或一维数组
function data_join(&$data)
{
if(get_magic_quotes_gpc() == false)
{
if (is_array($data))
{
foreach ($data as $k => $v)
{
$data[$k] = addslashes($v);
}
}
else
{
$data = addslashes($data);
}
}
Return $data;

判定数字的大小是否在某个范围内，假如仅仅是判定是否为数字无需使用。

# 判定数字大小，无大小的判定可以用系统带的 is_numeric($str)
#----------------------------------------------------------
Function isNumber ($fNum, $fMin="", $fMax="") {
if ( eregi("^[0-9] $", $fNum) ) {
if ( "" == $fMax && "" == $fMin ) {
Return True;
} elseif ( "" == $fMin && $fNum <= $fMax ) {
Return True;
} elseif ( "" == $fMax && $fNum >= $fMin ) {
Return True;
} elseif ( $fNum >= $fMin && $fNum <= $fMax ) {
Return True;
} else {
Return False;
}
} else {
Return False;
}
}

首先，让我们看看两个非凡的字符：’^’ 和 ‘$’ 他们是分别用来匹配字符串的开始和结束，一下分别举例说明：

"^The": 匹配以 "The"开头的字符串;

"of despair$": 匹配以 "of despair" 结尾的字符串;

"^abc$": 匹配以abc开头和以abc结尾的字符串，实际上是只有abc与之匹配；

"notice": 匹配包含notice的字符串；

你可以看见假如你没有用我们提到的两个字符（最后一个例子），就是说模式（正则表达式）可以出现在被检验字符串的任何地方，你没有把他锁定到两边。

这里还有几个字符 '*', ' ',和 '?', 他们用来表示一个字符可以出现的次数或者顺序. 他们分别表示："zero or more", "one or more", and "zero or one." 这里是一些例子:

"ab*": 匹配字符串a和0个或者更多b组成的字符串("a", "ab", "abbb", etc.);

"ab ": 和上面一样，但最少有一个b ("ab", "abbb", etc.);

"ab?":匹配0个或者一个b;

"a?b $": 匹配以一个或者0个a再加上一个以上的b结尾的字符串.

你也可以在大括号里面限制字符出现的个数，比如

"ab{2}": 匹配一个a后面跟两个b（一个也不能少）("abb");

"ab{2,}": 最少更两个b("abb", "abbbb", etc.);

"ab{3,5}": 2－5个b("abbb", "abbbb", or "abbbbb").

你还要注重到你必须总是指定 (i.e, "{0,2}", not "{,2}").同样，你必须注重到, '*', ' ', 和'?' 分别和一下三个范围标注是一样的，"{0,}", "{1,}", 和 "{0,1}"。

现在把一定数量的字符放到小括号里，比如：

"a(bc)*": 匹配 a 后面跟0个或者一个"bc";

"a(bc){1,5}": 一个到5个 "bc."

还有一个字符 '│', 相当于OR 操作:

"hi│hello": 匹配含有"hi" 或者 "hello" 的字符串;

"(b│cd)ef": 匹配含有 "bef" 或者 "cdef"的字符串;

"(a│B)*c": 匹配含有这样 - 多个（包括0个）a或b，后面跟一个c的字符串的字符串;

一个点('.')可以代表所有的单一字符:

"a.[0-9]": 一个a跟一个字符再跟一个数字的（含有这样一个字符串的字符串将被匹配，以后省略此括号）

"^.{3}$": 以三个字符结尾.中括号括住的内容只匹配一个单一的字符

"[ab]": 匹配单个的 a 或者 b ( 和 "a│b" 一样);

"[a-d]": 匹配'a' 到'd'的单个字符 (和"a│b│c│d" 还有 "[abcd]"效果一样);

"^[a-zA-Z]": 匹配以字母开头的字符串

"[0-9]%": 匹配含有形如 x％的字符串

",[a-zA-Z0-9]$": 匹配以逗号在加一个数字或字母结尾的字符串

你也可以把你不想要得字符列在中括号里，你只需要在总括号里面使用'^' 作为开头 (i.e., "%[^a-zA-Z]%" 匹配含有两个百分号里面有一个非字母的字符串).

为了能够解释，但"^.[$()│* ?{"作为有非凡意义的字符的时候，你必须在这些字符面前加'', 还有在php3中你应该避免在模式的最前面使用, 比如说,正则表达式 "($│?[0-9] " 应该这样调用 ereg("($│?[0-9] ", $str) (不知道php4是不是一样)

不要忘记在中括号里面的字符是这条规路的例外

标签：[!--infotagslink--]

上一篇: Email URL的判断和自动转换函数

下一篇: PHP自带函数大全

preg_replace比ereg_replace快多少？

您可能感兴趣的文章: