飓风算法 3.0(针对页面内容质量问题)

百度搜索于2017年7月4日发布飓风算法,严厉打击恶劣采集问题,在2018年9月13日公布飓风算法升级为2.0版本,在2019年8月对飓风算法进行升级,上线飓风算法3.0。

飓风算法主要针对以下页面内容质量问题:

 恶劣采集行为:

(1)存在大量从其他站点、智能小程序或公众号等内容生产方采集、搬运而来的内容,信息未经整合,排版混乱,文章可读性差,有明显采集痕迹,对用户无任何增益价值

问题示例1:文章有明显采集痕迹

1.png

(2)存在多段文章拼接的内容,文章逻辑性差,无法满足用户需求,阅读体验差

问题示例2:文章内容逻辑性差,阅读体验差

2.png

(3)站点或智能小程序内存在大量采集内容,自身内容生产力极差

 跨领域采集问题:

指站点/智能小程序为了获取更多流量,发布不属于站点/智能小程序领域范围的内容,通常这些内容采集自互联网,内容质量及相关性低、对搜索用户价值低。对于这样的行为搜索会判定该站点/智能小程序的领域专注度不足,会有不同程度的限制展现。

跨领域采集主要包括下面两类问题:

第一类:主站或主页的内容/标题/关键词/摘要等信息显示该站有明确的领域或行业,但发布内容与该领域不相关,或相关性较低

问题示例:美食类智能小程序发布足球相关内容

3.png

第二类:站点/智能小程序没有明确的领域或行业,内容涉及多个领域或行业,领域模糊、领域专注度低

问题示例:智能小程序内容涉及多个领域

4.png

 站群问题:

指批量构造多个站点/智能小程序,获取搜索流量的行为。站群中的站点/智能小程序大多质量低、资源稀缺性低、内容相似度高、甚至复用相同模板,难以满足搜索用户的需求。

问题示例:多个智能小程序复用同一模板,内容质量低、相似度高

5.png

返回顶部