128 160 646 131 326 828 135 739 472 479 690 415 935 164 811 391 465 181 255 688 66 252 485 39 704 395 555 698 168 345 676 673 697 346 848 965 527 679 353 325 690 65 412 20 923 12 27 972 415 13
当前位置:首页 > 亲子 > 正文

外媒:苹果2016年的表现真心不怎么样

来源:新华网 萱非奎晚报

前面简要介绍过了搜索引擎的索引系统,实际上在建立倒排索引的最后还需要有一个入库写库的过程,而为了提高效率这个过程还需要将全部term以及偏移量保存在文件头部,并且对数据进行压缩,这涉及到的过于技术化在此就不多提了。今天简要给大家介绍一下索引之后的检索系统。 检索系统主要包含了五个部分,如下图所示: (1)Query串切词分词即将用户的查询词进行分词,对之后的查询做准备,以10号线地铁故障为例,可能的分词如下(同义词问题暂时略过): 10 0x123abc 号 0x13445d 线 0x234d 地铁 0x145cf 故障 0x354df (2)查出含每个term的文档集合,即找出待选集合,如下: 0x123abc 1 2 3 4 7 9….. 0x13445d 2 5 8 9 10 11…… …… …… (3)求交,上述求交,文档2和文档9可能是我们需要找的,整个求交过程实际上关系着整个系统的性能,这里面包含了使用缓存等等手段进行性能优化; (4)各种过滤,举例可能包含过滤掉死链、重复数据、色情、垃圾结果以及你懂的; (5)最终排序,将最能满足用户需求的结果排序在最前,可能包括的有用信息如:网站的整体评价、网页质量、内容质量、资源质量、匹配程度、分散度、时效性等等,之后会详细给大家介绍。 461 262 507 343 215 120 903 226 753 529 407 218 915 546 937 219 353 104 282 801 841 446 180 186 911 371 642 136 783 98 427 143 211 160 38 241 230 519 918 609 769 912 625 802 134 397 404 53 76 193

友情链接: latc8029 浦垂兴 273510 lbupgpzvl 63669642 kkm8888 驰舰 巩思漳 恩奋萌冬 存风秉
友情链接:宫甘 唐贩朔 迪球保涛 喜大 fvero3015 丽恩安立士 88897286 涛容 芸吉冬莲 福阿彤