判断题
索引是指搜索引擎对抓取回来的内容逐一进行标记和识别,并将这些标记储存为结构化的数据,Spider对网站进行了爬行和抓取之后,需要对过滤后的页面进行预处理,这个预处理过程被称为“索引”。()
【参考答案】
正确
(↓↓↓ 点击‘点击查看答案’看答案解析 ↓↓↓)
点击查看答案&解析
相关考题
-
判断题
中文分词是中文搜索引擎特有的一步工作,中文分词(ChineseWordSegmentation)指的是将一个汉字序列切分成一个一个单独的词的过程。不同搜索引擎有不同的分词方法。() -
判断题
停止词是一些在页面内容中出现频率很高,但是对内容没有任何影响的词,如“的”“地”“得”之类的助词,搜索引擎在对页面建立索引之前会去掉这些停止词,使索引数据主题更为突出。() -
判断题
搜索引擎排名时需要去除的噪声并不是指网页中的嘈杂的声音,而是指页面上对页面主题没有贡献的内容,比如版权声明文字、导航条、广告等,这些内容对页面主题只能起到分散作用。搜索引擎需要识别并消除这些噪声,排名时不使用噪声内容。()
