脚本宝典收集整理的这篇文章主要介绍了php – 一种可靠的方式来刮取标题,描述和关键字,脚本宝典觉得挺不错的,现在分享给大家,也给大家做个参考。
//Parse for the tITle,description and keywords if (strlen($link_htML) > 0) { $tags = get_Meta_tags($link); // name $link_keywords = $tags['keywords']; // PHP documentation $link_description = $tags['description']; }
唯一的问题是人们现在正在使用各种元标记,例如开放图形< Meta PRoPErty =“og:title”content =“The Rock”/>.它们也会大量改变标签< title> <标题> < TITLE> <标题取代.要可靠地获得这些是非常困难的.
我真的需要一些能够一致地提取这些变量的代码.如果有一些标题,关键字和描述,只要它能找到它.因为现在它似乎很受欢迎.
也许是一种将所有标题提取到标题数组中的方法?然后,抓取Web开发人员可以选择最佳记录在他们的数据库中.同样适用于关键字和描述.
function get_title($url) { $tags = get_Meta_tags($url); $props = get_Meta_props($url); return @tags["title"] || @props["og:title"] || ... }
上面的实现显然效率不高(因为如果我们实现所有这样的getter你重新加载每个getter的URL),并且我没有实现get_Meta_props() – 使用pcre_ *正确实现是有问题的并且繁琐到使用DOMDocument实现.
尽管很多工作仍然是一个正确的实现 – 这是外部库解决问题的经典场景!幸运的是,只有一个 – 简称为“嵌入”,你可以在github找到它,或者使用作曲家运行
composer require embed/embed
以上是脚本宝典为你收集整理的php – 一种可靠的方式来刮取标题,描述和关键字全部内容,希望文章能够帮你解决php – 一种可靠的方式来刮取标题,描述和关键字所遇到的问题。
本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。