代码如下 | 复制代码 |
/** * CURL请求 * @param String $url 请求地址 * @param Array $data 请求数据 */ function curlRequest($url,$data='',$cookieFile=''){ $ch = curl_init(); $option = array( CURLOPT_URL => $url, CURLOPT_HEADER =>0, CURLOPT_RETURNTRANSFER => 1, ); if($cookieFile){ $option[CURLOPT_COOKIEJAR] = $cookieFile; $option[CURLOPT_COOKIEFILE] = $cookieFile; //$option[CURLOPT_COOKIESESSION] = true; //$option[CURLOPT_COOKIE] = 'prov=42;city=1'; } if($data){ $option[CURLOPT_POST] = 1; $option[CURLOPT_POSTFIELDS] = $data; } curl_setopt_array($ch,$option); $response = curl_exec($ch); if(curl_errno($ch) > 0){ throw_exception("CURL ERROR:$url ".curl_error($ch)); } curl_close($ch); return $response; } function login($username,$password){ if($username && $password){ $preLoginData = curlRequest('http://login.sina.com.cn/sso/prelogin.php?entry=weibo&callback=sinaSSOController.preloginCallBack&su='.base64_encode($username).'&client=ssologin.js(v1.3.16)','',self::COOKIE_FILE); preg_match('/sinaSSOController.preloginCallBack((.*))/',$preLoginData,$preArr); $jsonArr = json_decode($preArr[1],true); if(is_array($jsonArr)){ $postArr = array( 'entry' => 'weibo', 'gateway' => 1, 'from' => '', 'savestate' => 7, 'useticket' => 1, 'ssosimplelogin' => 1, 'su' => base64_encode(urlencode($username)), 'service' => 'miniblog', 'servertime' => $jsonArr['servertime'], 'nonce' => $jsonArr['nonce'], 'pwencode' => 'wsse', 'sp' => sha1(sha1(sha1($password)).$jsonArr['servertime'].$jsonArr['nonce']), 'encoding' => 'UTF-8', 'url' => 'http://weibo.com/ajaxlogin.php?framelogin=1&callback=parent.sinaSSOController.feedBackUrlCallBack', 'returntype' => 'META' ); $loginData = curlRequest('http://login.sina.com.cn/sso/login.php?client=ssologin.js(v1.3.16)',$postArr,self::COOKIE_FILE); if($loginData){ $matchs = array(); preg_match('/replace('(.*?)')/',$loginData,$matchs); $loginResult = curlRequest($matchs[1],'',self::COOKIE_FILE); $loginResultArr = array(); preg_match('/feedBackUrlCallBack((.*?))/',$loginResult,$loginResultArr); //$userInfo = json_decode($loginResultArr[1],true); //Log::info(var_export($loginResultArr[1])); }else{ throw_exception('Login sina fail.'); } }else{ throw_exception($preLoginData); } }else{ throw_exception('Param error.'); } } |
“^/d+$” //非负整数(正整数 + 0)
“^[0-9]*[1-9][0-9]*$” //正整数
“^((-/d+)|(0+))$” //非正整数(负整数 + 0)
“^-[0-9]*[1-9][0-9]*$” //负整数
“^-?/d+$” //整数
“^/d+(/./d+)?$” //非负浮点数(正浮点数 + 0)
“^(([0-9]+/.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*/.[0-9]+)|([0-9]*[1-9][0-9]*))$” //正浮点数
“^((-/d+(/./d+)?)|(0+(/.0+)?))$” //非正浮点数(负浮点数 + 0)
“^(-(([0-9]+/.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*/.[0-9]+)|([0-9]*[1-9][0-9]*)))$” //负浮点数
“^(-?/d+)(/./d+)?$” //浮点数
“^[A-Za-z]+$” //由26个英文字母组成的字符串
“^[A-Z]+$” //由26个英文字母的大写组成的字符串
“^[a-z]+$” //由26个英文字母的小写组成的字符串
“^[A-Za-z0-9]+$” //由数字和26个英文字母组成的字符串
“^/w+$” //由数字、26个英文字母或者下划线组成的字符串
“^[/w-]+(/.[/w-]+)*@[/w-]+(/.[/w-]+)+$” //email地址
“^[a-zA-z]+://(/w+(-/w+)*)(/.(/w+(-/w+)*))*(/?/S*)?$” //url
/^(d{2}|d{4})-((0([1-9]{1}))|(1[1|2]))-(([0-2]([1-9]{1}))|(3[0|1]))$/ // 年-月-日
/^((0([1-9]{1}))|(1[1|2]))/(([0-2]([1-9]{1}))|(3[0|1]))/(d{2}|d{4})$/ // 月/日/年
“^([w-.]+)@(([[0-9]{1,3}.[0-9]{1,3}.[0-9]{1,3}.)|(([w-]+.)+))([a-zA-Z]{2,4}|[0-9]{1,3})(]?)$” //Emil
“(d+-)?(d{4}-?d{7}|d{3}-?d{8}|^d{7,8})(-d+)?” //电话号码
“^(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5])$” //IP地址
匹配中文字符的正则表达式: [/u4e00-/u9fa5]
匹配双字节字符(包括汉字在内):[^/x00-/xff]
匹配空行的正则表达式:/n[/s| ]*/r
匹配HTML标记的正则表达式:/<(.*)>.*<///1>|<(.*) //>/
匹配首尾空格的正则表达式:(^/s*)|(/s*$)
匹配Email地址的正则表达式:/w+([-+.]/w+)*@/w+([-.]/w+)*/./w+([-.]/w+)*
匹配网址URL的正则表达式:^[a-zA-z]+://(//w+(-//w+)*)(//.(//w+(-//w+)*))*(//?//S*)?$
匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
匹配国内电话号码:(/d{3}-|/d{4}-)?(/d{8}|/d{7})?
匹配腾讯QQ号:^[1-9]*[1-9][0-9]*$
⊕本文来自: 北海情书 (php0.net">www.php0.net) 详细出处参考:http://www.php0.net/?p=827
文章介绍了如何利用正则先把字符中的图片地址取出来,然后再自动保存文章内容中的图片到本地,就是采集一样的方代码如下 | 复制代码 |
$URL='http://pp.baidu.com/';//任意网址 get_pic($URL); function get_pic($pic_url) { echo "<br>finished!!!"; /*得到图片类型,并将其保存到与该文件同一目录*/ foreach($pic_arr as $pic_item){//循环取出每幅图的地址 //通过微秒时间获得唯一ID //抓取网页内容 //curl_setopt($curl, CURLOPT_REFERER,$url); |
代码如下 | 复制代码 |
if (preg_match_all("/http://[^ "']+[.jpg|.gif|.jpeg|.png]+/ui",stripcslashes($content),$aliurl)){ $i=0; //多个文件++ while(list($key ,$v) = each($aliurl[0])){ //echo $v."<br />"; $filetype = pathinfo($v, PATHINFO_EXTENSION); //获取后缀名 $ff = @file_get_contents($v); //获取2进制文件内容 if(!stripos($v,"lao8.org")){//判断是否是自己网站下的图片 if (!empty($ff)){ //获取到文件就执行下面的操作 $dir = "upload/".date("Ymd")."/";//指定新的存储路径 if (!file_exists($dir)){//判断目录是否存在 @mkdir($dir,511,true); //创建多级目录,511转换成十进制是777具有可执行权限 } $nfn = $dir.date("Ymdhis").$i.".".$filetype; //构建文件的新名字 $nf = @fopen($nfn,"w"); //创建文件 fwrite($nf,$ff); //写入文件 fclose($nf); //关闭文件 $i++; //多文件++ echo "<img" width=100% src="".$nfn."">"; $content = str_replace($v,$nfn, $content);//替换content中的参数 }else{//获取不到图片则替换为默认图片 $content = str_replace($v,http://www.111cn.net/banner/banner.gif, $content);//替换content中的参数 } } } } |
代码如下 | 复制代码 |
function downloadFile($file){ $file_name = $file; $mime = 'application/force-download'; header('Pragma: public'); // required header('Expires: 0'); // no cache header('Cache-Control: must-revalidate, post-check=0, pre-check=0'); header('Cache-Control: private',false); header('Content-Type: '.$mime); header('Content-Disposition: attachment; filename="'.basename($file_name).'"'); header('Content-Transfer-Encoding: binary'); header('Connection: close'); readfile($file_name); // push it out exit(); } |