搜索引擎 2021年11月5日
0 收藏 0 点赞 1,023 浏览 1699 个字

算法名称:劲风算法
算法内容:控制恶意构造聚合页的问题对搜索用户的影响
发布时间:2020-02-27
原文详情:


近期,百度搜索技术团队发现,部分网站及智能小程序通过恶意构造聚合页面内容来获取搜索排名,获得搜索用户关注。为了保障搜索用户的体验、保证搜索结果公平,百度搜索将于近期上线劲风算法,控制恶意构造聚合页的问题对搜索用户的影响。

聚合页,是指页面并无文章主体内容,而是多个页面的索引链接围绕在特定主题下的信息整合页。

针对恶劣聚合页问题,搜索一经识别,将会结合站点及智能小程序的用户评价,限制其在搜索结果中的展现。此次算法覆盖百度搜索范围内的所有网站及智能小程序资源。

恶劣聚合页问题主要包括以下四种类型:

1、页面内容与站点本身所属领域不符,或站点无专注领域,多为采集拼凑内容。

问题示例1:站点内容领域分散

劲风算法详情及算法解读

2、页面内容与标题及页面中标记的标签不符。

问题示例2:页面内容与标题不符

劲风算法详情及算法解读

3、由网站搜索功能生成的静态搜索结果页。

问题示例3:静态搜索结果页

劲风算法详情及算法解读

4、空短、无有效信息、失效的聚合页。

问题示例4:无有效信息的聚合页
劲风算法详情及算法解读

以上四类恶劣聚合页问题就是这次劲风算法的主要内容。还请广大开发者关注,及时排查整改。


劲风算法解读

为了更好的帮助广大开发者了解劲风算法,避免出现类似问题影响站点、智能小程序在搜索中的表现,我们结合算法发布后大家关注度较高的问题逐一拆解说明,请广大开发者参考。

本次劲风算法主要针对以下四类恶劣聚合页问题:

一、内容跨领域

页面内容与站点本身所属领域不符,或站点无专注领域,多为采集拼凑内容。

整改建议:

1、开发者应当对站点进行全面自查,清理与站点所属领域不符的聚合页内容;

2、针对站点本身无专注领域的情况,建议开发者将站点内容收敛集中于某个主要领域下,生产专注于该领域的优质原创内容,通过提升内容专注度获得更多搜索用户的点击。

问题示例1:站点内容领域分散
劲风算法详情及算法解读

二、题文不符

聚合页内容与标题或标签描述不符,大部分情况是标题所描述的信息超出了页面的承载内容,甚至与页面内容毫不相关。

整改建议:

1、开发者可以评估页面内容与标题的相关性,以此筛选并清理内容与标题、标签不符的聚合页;

2、在内容生产的过程中,开发者应当提升内容与标题、标签的匹配度,保证页面的标题、标签能够准确概括页面内容,没有夸大或不实情况。

问题示例2:页面内容与标题不符
劲风算法详情及算法解读

三、静态搜索结果页

基于网站搜索功能大量生成的静态搜索结果页。

整改建议:

1、建议开发者不要生产此类页面,专注于生产满足用户需求的优质内容资源;

2、对于已有的静态搜索结果页,可以对百度搜索进行robots操作。

问题示例3:静态搜索结果页
劲风算法详情及算法解读

四、无效聚合页

空短、无有效信息、失效的聚合页。

整改建议:

1、请开发者对站点下的页面内容进行排查,清理低质、无效的聚合页面;

2、开发者在生产聚合页时,应当保证页面内容足够丰富、优质,避免出现聚合页中内容资源较少、不符合用户预期的情况。

问题示例4:未提供有效信息的聚合页
劲风算法详情及算法解读

除了以上整改建议外,针对此次劲风算法中开发者关注度较高的几个问题,我们给出了解答及引导,请广大开发者参考。

劲风算法Q&A

Q1:为什么要上线劲风算法?

A1:首先,批量生成的劣质聚合页会造成站内资源泛滥,占用搜索引擎资源,影响百度蜘蛛在收录过程中发现其他优质内容;
其次,通过技术手段批量生成的聚合页,通常存在标题信息对页面内容夸大甚至不实的问题,进而导致搜索用户获取的信息与用户预期之间有较大落差,伤害用户体验;
此外,部分开发者生产劣质聚合页,实际目的是为了吸引用户点击,以此获益,对搜索结果的公正性产生恶劣影响。

Q2:我的网站自带站内搜索功能,用户搜索时会产生正常的搜索结果聚合页,这种情况是否会对我的网站产生影响呢?对于静态的搜索结果页,网站难以排查,如果没有及时删除清理的话,是否会对站点在搜索中的评价产生影响?

A2:对于网站提供给访问者的动态搜索页面,此类页面不会被搜索引擎收录;
对于站点构造的静态搜索结果页,劲风算法会在识别后结合站点的整体搜索表现给予不同程度的处理。

劲风算法将于近期陆续上线,请广大开发者对照以上内容,尽快对自己站点中的聚合页进行排查整改,避免不必要的损失。

微信扫一扫

支付宝扫一扫

版权: 转载请注明出处:https://www.mizhanw.com/blog/seo/3933.html

相关推荐
百度搜索持续打击盗版网文站点公告
发布日期:2023-04-11 百度公司高度重视知识产权保护。近期,百度搜索通过主动摸排,并结合版权方的投诉与反馈,发现部分站点内存在大量涉…
日期:2023-04-14 点赞:0 阅读:320
Google 搜索关于 AI 生成内容的指南
长久以来,Google 一直坚信 AI 蕴含巨大的变革力量,能够提升我们提供实用信息的能力。这篇博文进一步介绍了 AI 生成的内容如何融入我…
日期:2023-03-02 点赞:0 阅读:900
如何增加蜘蛛爬取以及高价值url的发现!
前言: 本文主要增加蜘蛛爬取以及高价值url发现,而非友链外链操作,也可以称低价值url过滤,从而增加蜘蛛爬取。 蜘蛛是受到抓取系统调度影响…
日期:2023-01-31 点赞:0 阅读:635
经常被采集的技术层面处理方法
小站新站被采集,自己网站没收录或者没排名,被权重网站采集,而变成了别人的嫁衣,反馈又没有实质性可以证明自己的内容。注意:即使按照下面的说法做…
日期:2023-01-10 点赞:0 阅读:851
网站被黑处理以及查找本身存在后门方法!
一、网站被黑主要有三个原因造成,如下图。“2.服务器问题”以及“3.环境问题”出现的概率很少,主要讲讲“1.网站问题”。 二、网站存在后门通…
日期:2023-01-10 点赞:0 阅读:831
网站死链处理指南
直播回看地址:http://live.baidu.com/m/media/pc … 937643&source=h5pr…
日期:2023-01-10 点赞:0 阅读:371
发表评论
暂无评论

还没有评论呢,快来抢沙发~