php模拟登录获取SESSIONID，并则在读取网页的时候发送_php

方法1用curl：
一.先开启php curl函数库的步骤
1).去掉windows/php.ini 文件里;extension=php_curl.dll前面的; /*用 echo phpinfo();查看php.ini的路径*/
2).把php5/libeay32.dll，ssleay32.dll复制到系统目录windows/下
3).重启apache
二.例子
例子:

<?php
$cookie_jar = tempnam(''./tmp'',''cookie'');
$ch = curl_init(); curl_setopt($ch,CURLOPT_URL,''http://******'');
curl_setopt($ch, CURLOPT_POST, 1);
$request = ''email_address=&password=&action='';
curl_setopt($ch, CURLOPT_POSTFIELDS, $request);
//把返回来的cookie信息保存在$cookie_jar文件中
curl_setopt($ch, CURLOPT_COOKIEJAR, $cookie_jar);
//设定返回的数据是否自动显示
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
//设定是否显示头信息
curl_setopt($ch, CURLOPT_HEADER, false);
//设定是否输出页面内容
curl_setopt($ch, CURLOPT_NOBODY, false);
curl_exec($ch);
curl_close($ch); //get data after login

$ch2 = curl_init();
curl_setopt($ch2, CURLOPT_URL, ''http://*****'');
curl_setopt($ch2, CURLOPT_HEADER, false);
curl_setopt($ch2, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch2, CURLOPT_COOKIEFILE, $cookie_jar);
$orders = curl_exec($ch2);
echo '''';
echo strip_tags($orders);
echo '''';
curl_close($ch2);
?>
方法2用fsockopen：

<?php
function GetWebContent($host, $method, $str, $sessid = '''')
{
 $ip = gethostbyname($host);
//echo "ip=$ip ";
 [email=$fp=@fsockopen($ip,80]$fp=@fsockopen($ip,80[/email]);
 if (!$fp) return;
 fputs($fp, "$method ");
 fputs($fp, "Host: $host ");
 if (!empty($sessid))
 {
 fputs($fp, "Cookie: PHPSESSID=$sessid; path=/; ");
 }
 if ( substr(trim($method),0, 4) == "POST")
 {
 fputs($fp, "Content-Length: ". strlen($str) . " "); // 别忘了指定长度
 }
 //fputs($fp, "Content-Type: application/x-www-form-urlencoded ");
fputs($fp, "Content-Type: application/x-www-form-urlencoded ");
fputs($fp, "User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; InfoPath.1) )");//add by Ew 071012
fputs($fp, "Connection: Keep-Alive ");
 if ( substr(trim($method),0, 4) == "POST")
 {
 fputs($fp, $str." ");
 }
 while(!feof($fp))
 {
 $response .= fgets($fp);
 }
 $hlen = strpos($response," "); // LINUX下是 " "
 $header = substr($response, 0, $hlen);
//echo "header=$header<hr><hr>";
 $entity = substr($response, $hlen + 4);
 if ( preg_match(''/PHPSESSID=([0-9a-z]+);/i'', $header, $matches))
 {
 $a[''sessid''] = $matches[1];
 }
 if ( preg_match(''/Location: ([0-9a-z_?=&#.]+)/i'', $header, $matches))
 {
 $a[''location''] = $matches[1];
 }
 $a[''content''] = $entity;
 fclose($fp);
 return $a;
}

 $response = GetWebContent("$host","POST /$login_page HTTP/1.0", $str);//登入得到新的session_id
 //...可以在这里先保存session_id
 $response = GetWebContent("$host","GET /$somepage HTTP/1.0", '''', $response[''sessid'']);//使用session_id访问页面
 echo $response[''location''].$response[''content'']." ";
?>

<

滥用include
1.漏洞原因：
Include是编写PHP网站中最常用的函数，并且支持相对路径。有很多PHP脚本直接把某输入变量作为Include的参数，造成任意引用脚本、绝对路径泄露等漏洞。看以下代码：
...
$includepage=$_GET["includepage"];
include($includepage);
...
很明显，我们只需要提交不同的Includepage变量就可以获得想要的页面。如果提交一个不存在的页面，就可以使PHP脚本发生错误而泄露实际绝对路径(这个问题的解决办法在下面的文章有说明)。
2.漏洞解决：
这个漏洞的解决很简单，就是先判断页面是否存在再进行Include。或者更严格地，使用数组对可Include的文件作出规定。看以下代码：
$pagelist=array("test1.php","test2.php","test3.php"); //这里规定可进行include的文件
if(isset($_GET["includepage"])) //判断是否有$includepage
{
$includepage=$_GET["includepage"];
foreach($pagelist as $prepage)
{
if($includepage==$prepage) //检查文件是否在允许列表中
{
include($prepage);
$checkfind=true;
break;
}
}
if($checkfind==true){ unset($checkfind); }
else{ die("无效引用页！"); }
}
这样就可以很好地解决问题了。
小提示：有此问题的函数还有：require()，require_once()，include_once()，readfile()等，在编写的时候也要注意。
未对输入变量进行过滤
1.漏洞原因：
这个漏洞早在ASP中出现过，当时造成的注入漏洞不计其数。但由于PHP在当时的影响力较小，所以没有太多的人能够注意这点。对于PHP来说，这个漏洞的影响性比ASP更大，因为有比较多的PHP脚本使用到文本型数据库。当然也存在SQL语句的注入问题。举个比较经典的例子，首先是数据库的：
$id=$_GET["id"];
$query="SELECT * FROM my_table where id=''".$id."''"; //很经典的SQL注入漏洞
$result=mysql_query($query);
这里很明显我们可以用注入来获得数据库的其它内容了。这里就不再详细叙述，和ASP注入一样的，大家可以看看以前的黑防。然后我们看文本数据库的问题：
$text1=$_POST["text1"];
$text2=$_POST["text2"];
$text3=$_POST["text3"];
$fd=fopen("test.php","a");
fwrite($fd,"rn$text1&line;$text2&line;$text3");
fclose($fd);
文本的漏洞可以说是更加严重。倘若我们的提交的变量中插入一段很小的PHP代码，就可以另这个文本数据库test.php变成PHP后门。甚至插入上传代码，让我们可以上传一个完善的PHP后门。接着提升权限，服务器就是你的了。
2.漏洞解决：
这个漏洞的解决方法其实很简单，就是严格对全部提交的变量进行过滤。对一些敏感的字符进行替换。我们可以借助PHP提供的htmlspecialchars()函数来替换HTML的内容。这里给出一段例子：
//构造过滤函数 www.111cn.net
function flt_tags($text)
{
$badwords=array("操你妈","fuck"); //词汇过滤列表
$text=rtrim($text);
foreach($badwords as $badword) //这里进行词汇的过滤
{
if(stristr($text,$badword)==true){ die("错误：你提交的内容含有敏感字眼，请不要提交敏感内容 目录,文件操作详谈—php

前几天做了个小说连载的程序，因为怕更新麻烦，顺带就写了个采集器，采集八路中文网的，功能比较简单，不能自定义规则，不过大概思路都在里面了，自定义规则可以自己来扩展。

　　用php来做采集器主要用到两个函数：file_get_contents()和preg_match_all()，前一个是远程读取网页内容的，不过只在php5以上的版本才能用，后一个是正则函数，用来提取需要的内容的。

　　下面就一步一步来讲功能实现。

　　因为是采集小说，所以首先要将书名、作者、类型这三个提取出来，别的信息可根据需要提取。

　　这里以《回到明朝当王爷》为目标，先打开书目页，链接：http://www.86zw.com/Book/3727/Index.aspx

　　多打开几本书会发现，书名的基本格式是：http://www.86zw.com/Book/书号/Index.aspx，于是我们可以做一个开始页，定义一个<input type=text name=number>，用来输入需要采集的书号，以后就可以通过$_POST[‘number’]这种格式来接收需要采集的书号了。接收到书号，下面要做的就是构造书目页：$url=http://www.86zw.com/Book/$_POST[‘number’] /Index.aspx，当然这里是举个例子，主要是为了讲解方便，实际制作的时候最好检查一下$_POST[‘number’]的合法性。

　　构造好URL以后就可以开始采集书籍信息了。使用file_get_contents() 函数打开书目页：$content=file_get_contents（$url），这样就能将书目页的内容都读取出来了。接下来就是将书名、作者和类型等信息匹配出来了。这里就以书名为例，其他的都一样。打开书目页，查看源文件，找到“《回到明朝当王爷》”，这就是要提取出来的书名了。提取书名的正则表达式： /(.*?)/is，使用preg_match_all()函数将书名取出：preg_match_all("/(.*?)/is",$contents,$title);这样$ title[0][0]的内容就是我们要的标题了（preg_match_all函数的用法可以去百度查，这里就不详细说明了）。取出了书籍信息，接下来就是取章节内容了，要取章节内容，首先要做的就是找到每一章的地址，然后远程打开章节，用正则将内容取出来，入库或者直接生成html静态文件。这个是章节列表的地址：http://www.86zw.com/Html/Book/18/3727/List.shtm，可以看出这个和书目页一样，是有规律可寻的：http://www.86zw.com/Html/Book/分类号/书号/List.shtm。书号前面已经取得，这里的关键是找到分类号，分类号可以在前面的书目页找到，提取分类号：

　　preg_match_all("/Html/Book/[0-9]{1,}/[0-9]{1,}/List.shtm/is",$contents,$typeid);这样还不够，还需要一个切取函数：

PHP代码如下:

function cut($string,$start,$end){
$message = explode($start,$string);
$message = explode($end,$message[1]); return $message[0];}其中$string为要被切取的内容，$start为开始的地方，$end为结束的地方。取出分类号：

$start = "Html/Book/";
$end
= "List.shtm";
$typeid = cut($typeid[0][0],$start,$end);
$typeid = explode("/",$typeid);[/php]

　　这样，$typeid[0]就是我们要找的分类号了。接下来就是构造章节列表的地址了：$chapterurl = http://www.86zw.com/Html/Book/.$typeid[0]/$_POST[‘number’]/List.shtm。有了这个就能找到每一章节的地址了。

< 1. 使用 ip2long() 和 long2ip() 以整型(integer)方式储存IP地址到数据库，而非字符串方式。这将几乎减少一半的储存空间（char(15)15个字节，integer则是8个字节），而且也更容易计算某一IP地址是否在一个范围之内。同时也加速搜索和排序。

2. 应用checkdnsrr()检查域名是否存在，来验证email地址的一部分。这个checkdnsrr()内建函数可以通过相应的域名或者IP地址查询DNS记录。有PHP开发者利用这个函数编写了一个自定义函数，能验证email地址的一部分，点击查看。请注意，此函数在windows平台尚未实现！请用 PEAR 程序库的 Net_DNS 代替。

3. 如果你使用PHP 5 + MySQL 4.1 版本组合或其版本以上，得试试改进的 mysqli_* 函数，而不用 mysql_* 函数。mysqli_* 函数的一个优越的特点是可以使用 prepared 语句。如果你维护一个对数据库依赖性很大的网站，这个函数将大大提升数据库的查询速度。不信你可以看看这篇性能测试文章—MySQLi vs MySQL。最终结果是 mysqli_stmt > mysql_query > mysqli_query > mysqli_multi_query 。mysqli_stmt最佳。

4. 学会、爱用三元操作符( ternary operator )。也就是if/else条件语句的代替，用 “?:” 表示。

5. 不必重造车轮，先看看PEAR 程序库有没有人已经发明这个轮子了。

6. highlight_file()能格式化你的代码，美观漂亮。

7. 使用 error_reporting(0) 函数，阻止潜在的敏感错误信息显示给用户。最好的情况是能在服务器上配置php.ini文件，直接屏蔽错误报告的显示。但是如果使用虚拟主机就没那么幸运能够编辑修改php.ini文件了，得使用另外的方法：在php代码首行添加error_reporting(0); 语句。这样的好处是使得SQL查询语句和服务器的物理路径等这些敏感错误信息完全不显示给用户。

8. 大量字符串文本储存入数据库之前，使用 gzcompress() 和 gzuncompress() 进行压缩和解压缩的转换。这个内建函数使用gzip算法，对文本的压缩率达90％以上。当然，经过压缩就无法进行全文搜索了。

9. 在函数的参数传递中使用”引用传递”，可以返回多个值。有编程语言基础的程序员在其它语言就知道这个用法了；然而一些只会html语言的网页设计者就感到困惑了。答案就是使用 “&” 符号处理变量，并以引用传递而非按值传递。

标签：[!--infotagslink--]

上一篇: 用 Smarty 分离 PHP 应用程序中的形式与功能

下一篇: 用PHP创建UTF8文件

您可能感兴趣的文章:

● 写文件

和读取文件的方式一样,先看看是不是能写:

<?php

$file = ''dirlist.php'';
if (is_writable($file) == false) {
die("我是鸡毛,我不能");
}
?>

能写了的话可以使用file_put_contents函数写入:

<?php
$file = ''dirlist.php'';
if (is_writable($file) == false) {
die(''我是鸡毛,我不能'');
}
$data = ''我是可鄙,我想要'';
file_put_contents ($file, $data);
?>

file_put_contents函数在php5中新引进的函数(不知道存在的话用function_exists函数先判断一下)低版本的php无法使用,可以使用如下方式:

$f = fopen($file, ''w'');
fwrite($f, $data);
fclose($f);

替换之.

写文件的时候有时候需要锁定,然后写:

function cache_page($pageurl,$pagedata){
if(!$fso=fopen($pageurl,''w'')){
  $this->warns(''无法打开缓存文件.'');//trigger_error
  return false;
}
if(!flock($fso,LOCK_EX)){//LOCK_NB,排它型锁定
  $this->warns(''无法锁定缓存文件.'');//trigger_error
  return false;
}

php模拟登录 获取SESSIONID，并则在读取网页的时候发送

您可能感兴趣的文章:

php模拟登录获取SESSIONID，并则在读取网页的时候发送