扣丁学堂Python培训简述Python lxml解析HTML并用xpath获取元素的方法

发布时间:2019-06-10 发布网站:脚本宝典
脚本宝典收集整理的这篇文章主要介绍了扣丁学堂Python培训简述Python lxml解析HTML并用xpath获取元素的方法脚本宝典觉得挺不错的,现在分享给大家,也给大家做个参考。

本篇文章扣丁学堂Python培训小编给读者们分享一下Python lxml解析HTML并用xpath获取元素的方法,文中有代码列出供小伙伴们参加学习,对Python开发感兴趣的小伙伴就随小编来了解一下吧,希望对大家有所帮助

使用方法见注释

-- coding: UTF-8 --

From lxml import etree

source = u'''

<div><p class="p1" data-a="1">测试数据1</p>

<p class="p1" data-a="2">测试数据2</p>

<p class="p1" data-a="3" style="height:100px;">

测试数据3</p>

<p class="p1" data-a="4" width="200"><img src="1.jpg" class="img"/><br/>

图片</p>

'''

从字符串解析

page = etree.HTML(source)

元素列表

ps = page.xpath("//p")

for p in ps:

PRint u"属性:%s" % p.attrib

print u"文本:%s" % p.text

文本列表

ts = page.xpath("//p/text()")

for t in ts:

print t

xpath定位

ls = page.xpath('//p@class="p1"/img')

for l in ls:

print l.attrib

最后想要了解更多关于Python和人工智能方面内容的小伙伴,请关注扣丁学堂Python培训官网、微信等平台,扣丁学堂IT职业在线学习教育平台为您提供权威的Python开发环境搭建视频,Python培训后的前景无限,行业薪资和未来的发展会越来越好的,扣丁学堂老师精心推出的Python视频教程定能让你快速掌握Python从入门到精通开发实战技能。

脚本宝典总结

以上是脚本宝典为你收集整理的扣丁学堂Python培训简述Python lxml解析HTML并用xpath获取元素的方法全部内容,希望文章能够帮你解决扣丁学堂Python培训简述Python lxml解析HTML并用xpath获取元素的方法所遇到的问题。

如果觉得脚本宝典网站内容还不错,欢迎将脚本宝典推荐好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。