1.奇怪的strtok函数,可以根据制定参数分解字符串,每一部分相当于一个指针,需要配合循环语句才能完全执行完,注意第一参数只需给一次就ok了!,例如
[php]$a="xuandun同学:鉴于您的良好表现,特颁布本届诺贝尔和平奖|假的啦";
$c="|,:";
$b=strtok($a,$c);
while ($b){
echo "$b<br />";
$b=strtok($c);
}[/php]
2.explode函数,分解字符串为数组,这个其实前面学习的时候用到过,上例子:
[php]//把1111-11-11 按-分开为数组,并输出该数组
print_r(explode("-","1111-11-11"));[/php]
3.implode函数,终于把1111-11-11这个超级光棍节分开了,晕用它又恢复了,例:
[php]//先分开他,变成数组了
$a=explode("-","1111-11-11");
//该函数可以合并数组,使用第一个参数指定分隔符
echo implode("/",$a);[/php]
4.strpos函数搜索指定字符串第一次出现的位置(区分大小写,姊妹:stripos不区分大小写),不常用查手册
5.strrpos函数搜索指定字符串最后一次出现的位置(区分大小写,姊妹:strripos不区分大小写),不常用查手册
6.最频繁用的str_replace函数,替换字符串
[php]echo str_replace("帅哥","美女","我是帅哥");[/php]
7.strstr函数可以获取从指定字符串开始后面的字符,比若说提取邮箱的域名部分
[php]echo ltrim(strstr("admin@xuandun.com","@"),"@");
[/php]
因为是输出包括指定函数+后面的字符串,所以需要使用ltrim删除那个指定滴函数,查手册吧。
8.substr函数,指定位置读取字符串,查手册吧,写麻烦
9.统计指定字符串出现次数,substr_count函数
10.替换字符串内指定位置开始重新写为新的内容,substr_replace函数
11.刚才提前登场的ltrim函数,从字符串开始处删除字符,包括空格、换行、回车等等。rtrim函数删除从后面开始,teim函数从2头开始
12.str_pad函数,把字符串填充为指定长度的字符串,可以指定填充物,默认空格,更多参数手册吧
13.count_chars可以计算每个字符的出现频率,不常用 手册吧
14.str_word_count可以返回字符串里的所有单词成数组 不常用 手册吧
POSIX正则表达式函数
ereg()和eregi()
ereg_replace()和eregi_replace()
split()和spliti()
ereg()和eregi()ereg()字符串匹配函数,eregi()是ereg()函数的忽略大小的版本
语法格式:if (!ereg('^[^./][^/]*$', $userfile))//不匹配格式输出die
{
die('这是一个非法的文件名!');
}
ereg_replace()和eregi_replace(忽略大小写)替换
string eregi_replace (“正则表达式”,“目标替换字符”,“替换目标”)
语法格式:$string = "This is a test";
echo str_replace(" is", " was", $string);
echo ereg_replace("( )is", "\1was", $string);\1 为继承第一个整体
echo ereg_replace("(( )is)", "\2was", $string);\2继承第二个整体
split()和spliti(忽略大小写)用正则表达式将字符串分割到数组中
list:给数组中的值赋予一些变量
语法格式:$date = "04/30/1973";
list($month, $day, $year) = split ('[/.-]', $date);//列出三个变数对应格式//以什么形式拆分 拆分谁
echo "Month: $month; Day: $day; Year: $year<br />
";
输出结果Month: 04; Day: 30; Year: 1973
多行匹配
$rows = file('php.ini'); //将php.ini文件读到数组中
//循环便历
foreach($rows as $line)
{
if(trim($line))
{
//将匹配成功的参数写入数组中
if(eregi("^([a-z0-9_.]*) *=(.*)", $line, $matches)) //循环进行多行匹配
{
$options[$matches[1]] = trim($matches[2]);
}
unset($matches);
}
}
//输出参数结果
print_r($options);
PCRE正则表达式
PCRE全称为Perl Compatible Regular Expression,意思是Perl兼容正则表达式。
在PCRE中,通常将模式表达式(即正则表达式)包含在两个反斜线“/”之间,如“/apple/”。
元字符(Meta-character)
元字符 说明
A 匹配字符串串首的原子
Z 匹配字符串串尾的原子
b 匹配单词的边界 /bis/ 匹配头为is的字符串 /isb/ 匹配尾为is的字符串 /bisb/ 定界
B 匹配除单词边界之外的任意字符 /Bis/ 匹配单词“This”中的“is”
d 匹配一个数字;等价于[0-9]
D 匹配除数字以外任何一个字符;等价于[^0-9]
w 匹配一个英文字母、数字或下划线;等价于[0-9a-zA-Z_]
W 匹配除英文字母、数字和下划线以外任何一个字符;等价于[^0-9a-zA-Z_]
s 匹配一个空白字符;等价于[f
tv]
S 匹配除空白字符以外任何一个字符;等价于[^f
tv]
f 匹配一个换页符等价于 x0c 或 cL
匹配一个换行符;等价于 x0a 或 cJ
匹配一个回车符等价于x0d 或 cM
t 匹配一个制表符;等价于 x09或cl
v 匹配一个垂直制表符;等价于x0b或ck
oNN 匹配一个八进制数字
xNN 匹配一个十六进制数字
cC 匹配一个控制字符
模式修正符(Pattern Modifiers)
i -可同时匹配大小写字母
M -将字符串视为多行
S -将字符串视为单行,换行符做普通字符看待,使“.”匹配任何字符
X -模式中的空白忽略不计
U -匹配到最近的字符串
e -将替换的字符串作为表达使用
格式:/apple/i匹配“apple”或“Apple”等,忽略大小写。 /i
PCRE的模式单元
//1 提取第一位的属性
/^d{2}([W])d{2}\1d{4}$匹配“12-31-2006”、“09/27/1996”、“86 01 4321”等字符串。但上述正则表达式不匹配“12/34-5678”的格式。这是因为模式“[W]”的结果“/”已经被存储。下个位置“1”引用时,其匹配模式也是字符“/”。
当不需要存储匹配结果时使用非存储模式单元“(?:)”
例如/(?:a|b|c)(D|E|F)\1g/ 将匹配“aEEg”。在一些正则表达式中,使用非存储模式单元是必要的。否则,需要改变其后引用的顺序。上例还可以写成/(a|b|c)(C|E|F)2g/。
i
s
m
x
如果设置了这个修饰符, 模式中的没有经过转义的或不在字符类中的空白数据字符总会被忽略, 并且位于一个未转义的字符类外部的#字符和下一个换行符之间的字符也被忽略. 这个修饰符 等同于perl中的/x修饰符, 使被编译模式中可以包含注释. 注意: 这仅用于数据字符. 空白字符 还是不能在模式的特殊字符序列中出现, 比如序列(?(引入了一个条件子组(译注: 这种语法定义的 特殊字符序列中如果出现空白字符会导致编译错误. 比如( ?(就会导致错误.).
e
A
D
S
U
X
J
u
正则表达式在 PHP 中的应用在 PHP 应用中,正则表达式主要用于:
正则匹配:根据正则表达式匹配相应的内容
正则替换:根据正则表达式匹配内容并替换
正则分割:根据正则表达式分割字符串
在 PHP 中有两类正则表达式函数,一类是 Perl 兼容正则表达式函数,一类是 POSIX 扩展正则表达式函数。二者差别不大,而且推荐使用Perl 兼容正则表达式函数,因此
下文都是以 Perl 兼容正则表达式函数为例子说明。
定界符Perl 兼容模式的正则表达式函数,其正则表达式需要写在定界符中。任何不是字母、数字或反斜线()的字符都可以作为定界符,通常我们使用 / 作为定界符。具体
使用见下面的例子。
提示
尽管正则表达式功能非常强大,但如果用普通字符串处理函数能完成的,就尽量不要用正则表达式函数,因为正则表达式效率会低得多。关于普通字符串处理函数,请参见《
PHP 字符串处理》。
preg_match()preg_match() 函数用于进行正则表达式匹配,成功返回 1 ,否则返回 0 。
语法:
int preg_match( string pattern, string subject [, array matches ] )参数说明: 参数 说明
pattern 正则表达式
subject 需要匹配检索的对象
matches 可选,存储匹配结果的数组, $matches[0] 将包含与整个模式匹配的文本,$matches[1] 将包含与第一个捕获的括号中的子模式所匹配的文本,以此类推
例子 1 :
代码如下 | 复制代码 |
<?php |
浏览器输出:
A match was found:
例
<b>example: </b>, <div align=left>this is a test</div>
example: , this is a test
代码如下 | 复制代码 |
|
int preg_match ( string $pattern , string $subject [, array &$matches [, int $flags [, int $offset ]]] )
搜索主题的经常表达的方式给予配合
代码如下 | 复制代码 |
$subject = "abcdefwww.111cn.net";
) |
PHP在该例子中,由于使用了 i 修正符,因此会不区分大小写去文本中匹配 php 。
提示
preg_match() 第一次匹配成功后就会停止匹配,如果要实现全部结果的匹配,即搜索到subject结尾处,则需使用 preg_match_all() 函数。
例子 2 ,从一个 URL 中取得主机域名 :
代码如下 | 复制代码 |
<?php |
浏览器输出:
域名为:5idev.compreg_match_all()preg_match_all() 函数用于进行正则表达式全局匹配,成功返回整个模式匹配的次数(可能为零),如果出错返回 FALSE 。
语法:
int preg_match_all( string pattern, string subject, array matches [, int flags ] )参数说明: 参数 说明
pattern 正则表达式
subject 需要匹配检索的对象
matches 存储匹配结果的数组
flags 可选,指定匹配结果放入 matches 中的顺序,可供选择的标记有:
PREG_PATTERN_ORDER:默认,对结果排序使 $matches[0] 为全部模式匹配的数组,$matches[1] 为第一个括号中的子模式所匹配的字符串组成的数组,以此类推
PREG_SET_ORDER:对结果排序使 $matches[0] 为第一组匹配项的数组,$matches[1] 为第二组匹配项的数组,以此类推
PREG_OFFSET_CAPTURE:如果设定本标记,对每个出现的匹配结果也同时返回其附属的字符串偏移量
下面的例子演示了将文本中所有 <pre></pre> 标签内的关键字(php)显示为红色。
代码如下 | 复制代码 |
<?php $str = "<pre>学习php是一件快乐的事。</pre><pre>所有的phper需要共同努力!</pre>"; $kw = "php"; preg_match_all('/<pre>([sS]*?)</pre>/',$str,$mat); for($i=0;$i<count($mat[0]);$i++){ $mat[0][$i] = $mat[1][$i]; $mat[0][$i] = str_replace($kw, '<span style="color:#ff0000">'.$kw.'</span>', $mat[0][$i]); $str = str_replace($mat[1][$i], $mat[0][$i], $str); } echo $str; ?> |
正则匹配中文汉字正则匹配中文汉字根据页面编码不同而略有区别:
GBK/GB2312编码:[x80-xff>]+ 或 [xa1-xff]+
UTF-8编码:[x{4e00}-x{9fa5}]+/u
例子:
代码如下 | 复制代码 |
<?php Array ) |
代码如下 | 复制代码 |
<?php //1、取整个图片代码 //2、取width //3、取height //4、取src /*PHP正则替换图片img标记中的任意属性*/ //2、将src="/uploads/images/20100516000.jpg"替换为src="/uploads/uc/images/20100516000.jpg",并省去宽和高 |
例
正则取图片img标记中的任意属性
代码如下 | 复制代码 |
$word = '<p height="22" align="cenetr">111 22</p> <img" width=100% src="/upload/images/aaa.jpg" width="100"><div style="float:left;">中国人</div>'; $word = '<p height="22" align="cenetr">111 22</p> <img height="60"" width=100% src="/upload/images/aaa.jpg" width=100 style=><div style="float:left;">中国人</div>'; //取height //取src /*正则替换去掉或改变图片img标记中的任意属性***************************************************************/ //改变src属性(此处将原来的src="/upload/images/bbb.jpg"改变为src="/upload/_thumbs/Images/bbb.jpg") /*改变src属性, |
利用正则表达式删除两个字符串间的字符
代码如下 | 复制代码 |
<user> |
比如删除<user>和</user>之间的字符串:
代码如下 | 复制代码 |
|