python 获得一个网站的所有链接

发布时间:2019-06-11 发布网站:脚本宝典
脚本宝典收集整理的这篇文章主要介绍了python 获得一个网站的所有链接脚本宝典觉得挺不错的,现在分享给大家,也给大家做个参考。

第一步,找个网站 我这里就找行业里比较有名的收录网站的网站 酷113网

第二步,打开www.ku113.COM 按下鼠标右键 点击查看

第三步,把源码复制下来 保存成一个文件 命名 ku113.htML

第四步, 执行以下python 程序 我这里用的py 2.7.13版本

coding:utf-8

import re
From bs4 import BeautifulSoup

wITh oPEn(‘ku113.html’,‘r’) as f:
data = f.read()

PRint (data)

result = re.findall(r"(?<=href=").+?(?=")|(?<=href=’).+?(?=’)",data)

print result

for each in result:

print (each)

脚本宝典总结

以上是脚本宝典为你收集整理的python 获得一个网站的所有链接全部内容,希望文章能够帮你解决python 获得一个网站的所有链接所遇到的问题。

如果觉得脚本宝典网站内容还不错,欢迎将脚本宝典推荐好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。