什么是黑名单页面呢?简而言之就是那些内容质量很好的页面,但是一直没有被百度收录,一个网站不可能做到百分百的收录率,可一些内容质量好的页面不收录,总是感觉很可惜。这样的情况我们在做优化的时候经常碰到,可以说几乎每个站点都有一些所谓的黑名单页面,比较典型的例子:一个权重很高的大型网站,几篇原创内容的内页,百度蜘蛛也正常爬取过,但就是不收录,当然一些小站中这样的页面就更多了。那么如何才能让这些页面重新被收录呢?或者说如何才能让整站的收录率上去呢?下面先来分析下百度为何不收录那些质量很高的页面?笔者总结为以下几个因素:
第一个因素就是网站的整体权重,这点是显而易见的,网站权重高一般情况下收录的页面就多,当然一个大型网站的会遇到收录瓶颈,百度对一个网站的收录量是有限的,当到达一定收录量以后,再继续收录页面就比较困难了。网站权重高的大型网站,即便是转载其他站点的文章,同样也会被大量的收录,而一些小站即便是原创,有时候也很难收录,尤其是当小站上的内容被大站转载后。第二个因素就是站内结构做的不好,比方说URL不标准,URL中包含太长的参数等,第三个因素是某些页面蜘蛛爬行的次数太少,缺乏更多的入口,换句话说就是要做给蜘蛛创造些入口链接,可以做一些高质量的链接。第四个因素是某些内页给百度的第一次印象太差,需要吸引百度蜘蛛重新去爬行、抓取,搞清楚百度长期不收录的原因,接下来就可以着手解决了。
第一:给黑名单页面URL增加更多的蜘蛛入口
站内布局好内部链接,站外需要做更多的外链,两者方法去增加更多的百度蜘蛛入口,同时也是提升内页的权重,权重变高了,被收录的几率就越大,不过对于一些大型网站来说,要做到这点难度是非常大的。要多给那些黑名单页面一些内部链接,与这些页面相关的页面都可以互相链接,内部链接的作用对于权重来说,可能不太重要。毕竟内部链接不算是别人的投票,至于外部链接的作用应该是很明显的,这些黑名单页面不能靠“自然的收录”,例如可以给这些URL一些高质量的友情链接,或者其他类型的外部链接,吸引百度蜘蛛去爬行这些URL。这是我们常用的方法,除此之外将URL直接提交给百度也行,不过有时候感觉效果太慢了。
第二:修改黑名单页面的内容,包括HTML源文件
页面质量低不被百度收录是很正常的,黑名单页面都是一些质量不错的页面,不知道什么何原因这些页面给百度的第一印象太差,之后百度就弃之不顾了。想要百度重新认可这些页面,那最好还是改头换面一次吗,对这些内容进行修改或者干脆重写,当然还有页面的HTML源文件,其实也可以去尝试修改下。除此之外页面的标题、关键词、描述,这些信息也要去修改和完善,这样百度就会重新审核那些黑名单的页面,自然也有可能重新收录这些页面。或者可以先删除这些黑名单的页面,反正这些页面也没有被收录,然后再重新创建一个内容页面,这样其实就是自己重新删除黑名单页面。
第三:确保URL符合标准,降低整站页面相似度
URL不标准是导致页面不收录的一个重要因素,所以我们在做优化的时候必须注意这点,一般在中小企业站上常会碰到这样的情况,说实话不太容易修改,最好在做站的时候避免一下。尽量采用静态页面,即便是动态页面也不要有很长的参数,查看下自己的那些黑名单页面是不是URL不太规范。还有一点就是页面相似度的问题,通常可以通过调整页面显示的内容来避免页面相似度过高,不过很多情况下SEO人员没有权利去修改页面的模板,毕竟网站不能为SEO而生存,电商类站点更看重的页面用户体验和转化率。没办法只能去和其他部门协调一下了!以上笔者总结了几种方法,其实没有什么创新的东西,只是在操作的时候很难做到最完美的境界。
要真正解决网站收录的问题其实很难,在大型网站中收录问题始终让SEO人头大,我们追求的是最大的收录率,一个站点有几万个页面和几十个万个页面,两者完全是不同的概念。小站做好收录应该不成问题,但是大站就很不容易了,关于那些黑名单页面,你是如何操作的呢,大家不妨一起实验、研究下。文章来源:宝鉴TXT下载http://www.222wx.com/book/94 原创发布 转载保留地址 |
温馨提示:资源转载网络个人收藏,如有侵权或下载链接失效或密码不对请联系站长
1、在论坛里发表的文章仅代表作者本人的观点,与本网站立场无关。
2、论坛的所有内容都不保证其准确性,有效性,时间性。阅读本站内容因误导等因素而造成的损失本站不承担连带责任。
3、当政府机关依照法定程序要求披露信息时,论坛均得免责。
4、若因线路及非本站所能控制范围的故障导致暂停服务期间造成的一切不便与损失,论坛不负任何责任。
5、注册会员通过任何手段和方法针对论坛进行破坏,我们有权对其行为作出处理。并保留进一步追究其责任的权利。