Google 优化蜘蛛爬取和索引的技巧_建站经验

上一篇: 网站发展中20条禁令推荐下一篇:网站上线前要做的准备工作

Google 优化蜘蛛爬取和索引的技巧

发布时间：2022-05-10 发布网站：脚本宝典

脚本宝典收集整理的这篇文章主要介绍了Google 优化蜘蛛爬取和索引的技巧，脚本宝典觉得挺不错的，现在分享给大家，也给大家做个参考。

由于GOOGLE掌控者搜索市场的大部分的份额，所以应时时关注和听取它的一些动态。“Google发表了一篇叫做优化蜘蛛爬取和索引的技巧”，是不是该引起我们的注意呢？

文中内容高度强调可以提高你站点爬取的能力的一些技巧，下面是陈列的关于URL的具体的例子。
 
“互联网是个大世界，时时刻刻都有新的内容被发表，创造，”Google 分析师Susan Moskwa说到。“Google 拥有无限的资源，所以当它面临几乎无限的在线的可利用的资源时，google的蜘蛛只有能力去找寻和爬取一部分的内容，而面对已经爬取了的内容，我们又只能索引一部分。”

;moskwa说：“URL就像一座连接你站点和搜索引擎蜘蛛之间的桥梁，蜘蛛需要能够找到并通过这座桥梁（IE,找到并爬取你的URL）到达你的网站内容页，如果你的url地址过于复杂或是太冗余，蜘蛛就要花费很多时间去跟踪并反跟踪自己爬取的脚印，如果URL地址被很好的组织着，并直接指向相关区域的内容，这样就不会爬取到空白或是重复的内容页了。”

如果你想被Google更好的索引，你必须删除URL地址中用户具体信息。具体情况可浏览幻灯片。基本上URL的参数时不会改变网页的内容，所以这些参数应该要删除或是放入cookie中。这样就会减少很多URL指向同一个内容的数量，加快检索。（这里应该指的就是尽量使用静态地址，少产生一些用户自带的参数的重复URL）

Google说漫无目的的无限的空间和广度其实很浪费时间，所以对于那些是唯一地址的不管是过去的还是将来的url地址，最好有一个时间标志。例如example/2009/08//11/tITle

告诉Google那些网页可以忽略它不需要爬取。包括一些登陆的页面，联系方式，购物车和其他的页面，类似于要求用户去执行的行为，蜘蛛是无法识别操作的。可以通过使用robots.txt文件来实现。

最后，尽可能避免重复的内容。Google希望每一个内容页面都对应一个唯一的地址。当然他们不可能全部的识别出来，因此会有一些典型链接因素存在让你去鉴别哪些特定内容网页的URL更被人们喜爱。

脚本宝典总结

以上是脚本宝典为你收集整理的Google 优化蜘蛛爬取和索引的技巧全部内容，希望文章能够帮你解决Google 优化蜘蛛爬取和索引的技巧所遇到的问题。

如果觉得脚本宝典网站内容还不错，欢迎将脚本宝典推荐好友。

本图文内容来源于网友网络收集整理提供，作为学习参考使用，版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ：384754419，请注明来意。

标签：

上一篇: 网站发展中20条禁令推荐下一篇:网站上线前要做的准备工作

猜你在找的建站经验相关文章