php – 尝试使用HTML DOM解析器在Amazon页面上获取主图像_php教程

上一篇: php – gettext()等同于Intl库？下一篇:如何通过命令行将$_GET变量传递给...

php – 尝试使用HTML DOM解析器在Amazon页面上获取主图像

发布时间：2022-04-30 发布网站：脚本宝典

脚本宝典收集整理的这篇文章主要介绍了php – 尝试使用HTML DOM解析器在Amazon页面上获取主图像，脚本宝典觉得挺不错的，现在分享给大家，也给大家做个参考。

我正在尝试使用 HTML DOM Parser来获取“主”产品图像的图像源,无论解析器指向哪个产品页面.

在每个页面上,似乎该图像的id为“landingImage”.
你会认为这应该是诀窍：

$finalarray[$i][2] = $htML->find('img[id="landingImage"]',0)->src;@H_404_5@ 
 但没有这样的运气. 
 我也试过 
  
 foreach($html->find('img') as $e)
    if (strpos($e,'landingImage') !== false) { 
        $finalarray[$i][2] = $e->src;
    }@H_404_5@ 
 我注意到,通常图像源有SY300或SX300,所以我这样做： 
  
 foreach($html->find('img') as $e)
    if (strpos($e,'SX300') !== false) { 
        $finalarray[$i][2] = $e->src;
    }
    else if (strpos($e,'SY300') !== false) { 
        $finalarray[$i][2] = $e->src;
    }@H_404_5@ 
 不幸的是,一些图像源链接不包含,例如： 
  
 http://www.amazon.COM/gp/PRoduct/B001O21H00/ref=as_li_ss_tl?ie=UTF8&amp;Camp=1789&creative=390957&creativeASIN=B001O21H00&linkCode=as2&tag=bmref-20@H_404_5@

使用Amazon API可能是更好的解决方案,但这不是问题.

当我从示例网页(没有运行JavaScript的内容)下载html时,我找不到id =“landingImage”[1]的任何标签.但是我可以找到一个id =“main-image”的图像标签.尝试使用DOMDocument提取此标记不成功.不知何故的方法 loadhtml()和loadHTMLFile()不能解析html.

但有趣的部分可以用正则表达式来提取.以下代码将为您提供图像源：

$url = 'http://www.amazon.com/gp/product/B001O21H00/ref=as_li_ss_tl?ie=UTF8&camp=1789&creative=390957&creativeASIN=B001O21H00&linkCode=as2&tag=bmref-20';
$html = file_get_contents($url);

$matches = array();
if (preg_match('#<img[^>]*id="main-image"[^>]*src="(.*?)"[^>]*>#',$html,$matches)) {
    $src = $matches[1];
}

// The source of the image is
// $src: 'http://ecx.images-amazon.com/images/I/21JzKZ9%2BYGL.jpg'@H_404_5@ 
 [1] html源码已在PHP中下载,功能为file_get_contents.使用Firefox下载html源代码会导致不同的HTML代码.在最后一种情况下,您会发现一个带有id属性“landingImage”(JavaScript未启用！)的图像标签.看来下载的html源码依赖于客户端(http请求中的头文件).

脚本宝典总结

以上是脚本宝典为你收集整理的php – 尝试使用HTML DOM解析器在Amazon页面上获取主图像全部内容，希望文章能够帮你解决php – 尝试使用HTML DOM解析器在Amazon页面上获取主图像所遇到的问题。

如果觉得脚本宝典网站内容还不错，欢迎将脚本宝典推荐好友。

本图文内容来源于网友网络收集整理提供，作为学习参考使用，版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ：384754419，请注明来意。

标签：amazon dom html php 主使用使用器图像图像尝试获取获取解析解析页面页面

上一篇: php – gettext()等同于Intl库？下一篇:如何通过命令行将$_GET变量传递给...

猜你在找的php教程相关文章

浅谈Windows下 PHP4.0与oracle 8的连接设置 2022-04-30
PHP｜入阶PHP-FPM 2019-08-07
PHP 规范开发（二）：测试 2019-08-07
使用php 爬取拉勾网的php 招聘信息~ 2019-08-07
php 实现分布式文件服务器 2019-08-07
【PHP】php安装bcmath扩展脚本 2019-08-07
php资源收集 2019-08-07
【面向对象的PHP】之模式：目录 2019-08-07
php 安装zip模块 2019-08-07
PHP 8 中新特性以及重大调整 2022-05-30