脚本宝典收集整理的这篇文章主要介绍了【技术性】Search知识,脚本宝典觉得挺不错的,现在分享给大家,也给大家做个参考。
持续更新。
- FB seArch框架
Php写的browse layer,负责同client对话以及param处理和passing等。
C++写的backend,最大的一坨叫做TopAggregator,主要负责三件事 a)rewrITe query to get better search results (e.g. force retrieval); b)和每个vertical的RackAggregator对话,比如posts,web,PEople等,从这些分支收集response; c)对response做twiddling,所以有一堆twiddlers比如web twiddler
每个RackAggregator做的事主要就是和index对话,从各个shards拿结果(用reverse index做retrieval, top m, determined by static rank),以及score results(用forward index / docdata做ranking)。
然后再返回php的middle tier,做caching, PRivacy check等等。
- Forward index和Reverse index
f index主要是给id找doc,r index主要是给出terms找list<doc(id)>
- index build:
也是分batch pipeline (base index build)和live update pipeline (realtime)。
以上是脚本宝典为你收集整理的【技术性】Search知识全部内容,希望文章能够帮你解决【技术性】Search知识所遇到的问题。
本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。