Node.js 爬虫

发布时间:2019-06-03 发布网站:脚本宝典
脚本宝典收集整理的这篇文章主要介绍了Node.js 爬虫脚本宝典觉得挺不错的,现在分享给大家,也给大家做个参考。

今天搜了一个nodejs的爬虫. 尝试着爬了一下jd.COM.
但是一直返回302,最终发现是User-Agent问题, node执行js时没有User-Agent.

VAR http    = require('http');
var url        = require('url');
var $ = require('jquery');

var options = {
    headers: {'User-Agent': 'curl/7.43.0'},
    host: 'seArch.jd.com',
    path: '/Search?keyword=abc&enc=utf-8',
    url: '/Search?keyword=%E9%93%B6%E9%B3%95%E9%B1%BC&enc=utf-8'

}
http.get(options,function(res){
    var body = '';
    res.on('data', function(d) {
        body += d;
    });
    res.on('end',function(){
        console.LOG(body);
    });
})

脚本宝典总结

以上是脚本宝典为你收集整理的Node.js 爬虫全部内容,希望文章能够帮你解决Node.js 爬虫所遇到的问题。

如果觉得脚本宝典网站内容还不错,欢迎将脚本宝典推荐好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。