新链接重要程度判断
好啦,上面我们说了影响 Baiduspider 正常抓取的原因,下面就要说说 Baiduspider 的一些判断原则了。在建库环节前,Baiduspider 会对页面进行初步内容分析和链接分析,通过内容分析决定该网页是否需要建索引库,通过链接分析发现更多网页,再对更多网页进行抓取——分析——是否建库 & 发现新链接的流程。理论上,Baiduspider 会将新页面上所有能 “看到” 的链接都抓取回来,那么面对众多新链接,Baiduspider 根据什么判断哪个更重要呢?两方面:
第一,对用户的价值
- 内容独特,百度搜索引擎喜欢 unique 的内容
- 主体突出,切不要出现网页主体内容不突出而被搜索引擎误判为空短页面不抓取
- 内容丰富
- 广告适当
第二,链接重要程度
- 目录层级——浅层优先
- 链接在站内的受欢迎程度