百度搜索引擎的正排索引详解

原创 admin  2018-03-22 18:12 

正向索引称为正向索引,它是用以下字段创建一个倒排索引的基础。

(1)的localld字段(表盖):一个文件的本地号码。

(2)wordld场:分词后的数量,或指数。

(3)nhits领域:次索引词的数量出现在文档中。

(4)目标可变长度字段:文件中,这是一个索引词的位置,偏移量相对于体。

因为在一篇文章中有些字可能出现反复,和不同的位置,和全文检索的本质要求是标记的位置,所以每个hitlist打说索引词出现在一个给定的位置,在文件中,序列是单调递增的序列。基于游程编码的方法,变量递增的序列的差分序列,使用可变字节编码方法编码可以大大压缩了指数目标领域。

事实上,在不同的计算过程文件的个数,称为本地号码和全球数,数的长度略有不同,为了便于理解,不区分这些差异,这localld和Docld是完全相同的,只有一个文件说不。在正向指标localld与升序序列数(假设数量递增1通过增加),这为下面的计算条件,倒排索引的转变,盖在自然向前的索引顺序,所以提出指数下跌到自然界中创建索引的过程可以保证每个字对应的指数倒命令文件数。

基本上,提出了索引文件数为指数的角度来看,是通过文件编号索引词。文件编号给知道索引词包含的次数,这些指标的出现,对索引词的位置。然而,全文索引检索的关键词,而不是通过文献检索等数,正向指标不能满足全文检索的要求。

虽然正向索引不能满足全文检索的需要,但正向索引建立倒排索引并创造有利条件,是不可或缺的倒排索引计算之一。

本文地址:http://seo8seo.cn/?p=59
关于我们:滨州网站推广黄药师-东邪站:欢迎访问我们的网站!网络知识的海洋。
版权声明:本文为原创文章,版权归 滨州网站建设 所有,欢迎分享本文,转载请保留出处!

发表评论


表情