function get_all_url($code){&nbs
p; preg_match_all('/<as+
href=["|']&
#63;([^>"' ]+)["|']?s*[^>]*>([^>]+)</a>/i',$code,$arr);
return array('n
ame'=>$arr[2],'url'=>$arr[1]);
}
$s
ITe=s
ubstr($url,0,strpos($url,"/",8));//站点
$base=substr($url,0,strrpos($url,"/")+1);//文件所在目录
$fp = fo
PEn($url, "r" );//打开url
while(!feof($fp))$contents.=fread($fp,1024);//
$pattern="|href=['"]?([^ '"]+)['" ]|u";
PReg_match_all($pattern,$contents, $regarr, preg_set_order);//匹配所有href=
for($i=0;$i<count($regarr);$
i++){//遍历所有匹配
if(!eregi("://",$regarr[$i][1]))//
是否是相对路径,即是否还有://
if(substr($regarr[$i][1],0,1)
=="/")//是否是站点的根目录
echo "link".($i+1).":".$site.$regarr[$i][1]."<
br/>";//根目录
else
echo "link".($i+1).":".$base.$regarr[$i][1]."<br/>";//当前目录
else
echo "link".($i+1).":".$regarr[$i][1]."<br/>";//相对路径
}
fclose($fp);