相关考题
-
多项选择题
下列选项中,属于应对反爬虫策略的是()
A.降低访问频率
B.使用代理ip
C.识别验证码
D.伪装User-agent -
多项选择题
下列选项中,属于URL 的组成元素的是()
A.IP地址
B.服务器
C.路径
D.协议头 -
多项选择题
关于聚焦爬虫的工作原理,下列描述正确的是()
A.根据一定的搜索策略,从URL 队列中选择下一步要抓取的网页URL
B.我们需要根据爬取需求定义聚焦爬虫的爬取目标,并进行相关的描述
C.聚焦爬虫会根据一定的网页分析算法过滤与主题无关的链接,保留有用的链接
D.有用的链接会放入等待抓取的URL 队列
