php – 如何从网页获取内部链接?

发布时间:2022-04-30 发布网站:脚本宝典
脚本宝典收集整理的这篇文章主要介绍了php – 如何从网页获取内部链接?脚本宝典觉得挺不错的,现在分享给大家,也给大家做个参考。
我使用xpath来解析 HTML网页以获取所有内部链接. DOMXPath将返回href中提供的所有链接.如何将内部外部链接分开?

我介绍了一系列字符串检查来删除外部链接;但问题是有不同的方式来链接内部页面,如

page.htML
    /page.html
    http://domain.COM/page.html
    http://subdomain.domain.com/page.html
    ....

区分内部链接(指向当前域的任何链接,包括其子域)和外部链接(到任何其他域)的最安全的方法是什么.

解决方法

使用 substr()查看前4个字符是否为http.

如果是,请使用parse_url()功能检查主机是否相同.如果没有,那就是内部的.

脚本宝典总结

以上是脚本宝典为你收集整理的php – 如何从网页获取内部链接?全部内容,希望文章能够帮你解决php – 如何从网页获取内部链接?所遇到的问题。

如果觉得脚本宝典网站内容还不错,欢迎将脚本宝典推荐好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。