百度收录永远是SEOer们讨论的关键话题,在搜索引擎网站优化的战争中,能够得到稳定的收录会直接影响到网站的流量。但很多人疑问:为什么网站的首页更新的很快,而推广时就是不收录内页,而单单只是收录首页一个空売呢?相信也有许多的朋友和我一样在寻找问题的答案。
本文一起探讨网站只收首页不收内页的原因分析与解决方法。
1、百度己经收录了但还示被放出来
百度对文章的收录也是需要审核时间的,蛛蛛抓取成功的索引内容会录入到数据库,这也是需要经过二次的审查是否被判为SPAM然后才放出来并参于排名,具体放出的时间与网站的权重高低有着相对的直接关系,而百度周期更新时才放出收录较为常见的为新站。
解决对策:我们要做的就是:保证内容定期定量的更新,并进行对网站日志的观察及分析,只要蛛蛛正常爬行,那么您就可以静心的等待着,百度会给你一个惊喜。
2、robots设置问题也会导致网站内页不受到搜索引擎的索引
解决对策:检查是否语法错误屏蔽到了蛛蛛的爬行,其中有包括:meta robots与nofollow等标签的设置。
3、网站的内部链接存在问题
在网络营销时比如造成了大量的错误链接,不良链接,蛛蛛爬行的不通畅,或根本无法抓取,那么这些不良的网址也会导致您网站降权。
解决对策:百度针对网站的首页,频道等各个重要的页面进行做错误的链接检查,会检查到留言板,评论版块,等等网友能互动的功能之不良链接,尽量避免不良网站互链。
4、网站在推广的过程中使用了黑帽的手段,百度识别到欺骗手段就会对整站进行降权。
解决对策:不做关键词堆砌,不群发,不做黑链等黑帽行为,网站保持稳定,少动歪脑筋,如果一意孤行的做了,那百度一有动作,网站就很难再被挽回了。
5、与文章的原创度相关
头部标签的设置会导致页面类似的重复,或者是采集的页面太多时,百度数据库中己存有大量的相似信息而不收录你,如果是长期的这样操作会导致百度降权。
解决对策:多些保持文章的原创度(高度伪原创)质量比数量重要,最好是每天都能够定时定量的更新,这样百度对你的网站抓取也有了守时的好习惯。
6、服务器访问情况
如无法访问,速度缓慢,被挂马等情况。在百度蜘蛛来抓取内容时,多次识别网站有着大量的错乱码或者是遇到了服务器无法访问,那么网站因由也会被列入观察名单。
解决对策:做好网站代码优化,提高页面的读取速度,选择好安全的空间服务商,成熟的网站程序编码,并定期的更新补丁,定期对修改文件痕迹做好跟踪。百度只收录了网站首页分两种情况,一种是新网站只被百度收录了首页,另一种是网站很长时间了,也是只被百度收录了首页而已。针对这两种情况,应该如何解决呢?
新站点出现这种情况时,要先明确网站到底有多新。假设网站从创建到被百度收录首页在10天之内的,那请你不要着急,耐心的再等上5天左右的时间,90%的概率会得到改善。
不过这里还是要提醒你,新网站创建成功之后,你把很多的网站优化的问题都确定完善了。这时,每天应该保证按时、按量的更新至少1篇优质内容,我建议是3篇以上,至于以上多少根据能力而定。但质量一定过关。
针对新站点的列表页、栏目页、频道页不被收录的。你最先想到的办法还是更新,因为这些页面都会随着你文章、内容的发布,这些页面或多或少也会变化。每天保持着变化。爬虫就会到访你的网站,在搜索引擎多次考究之后觉得你的文章内容质量高、更新频率高、页面体验好的情况。你的内容就会瞬间被放出来很多。
所谓放出来,是指其实百度早就收录了你很多的内页,只是对新站有一个考察期。在考察期内没有把这些收录的内页放出来。自然你就不知道是不是收录了。
在这样的时间范围内,只有5%以内的是还在考察期。剩下的95%基本会被搜索引擎判定为低质量站点,你的内容质量低下,用户体验也不好,内容本身语句不通,更不能解决用户需求。这样的站点被评定为低质量站点后,就会导致长时间不收录内容。
在这时候,你需要考虑以下四点因素:
文章质量是否达标?
文章质量首先我们要说一下文章是否为原创文章,这个时候需要我们利用原创文章检测工具进行检测,才能获知文章的原创度,低于80%原创度的,都不能被看作原创文章。
额外文章的字数,千万别写个100~200字来敷衍了事。你可能会想到,我这篇文章的主题也就能写这么多字,但一定能够更多吗,实在没有更多就写一些延展阅读的东西为读者提供更丰富多元且相关的内容。
然后是文章的排版,你的字体应该与背景色有明显区分,字号不要低于14px,现在一般都至少16px了。段落间、字间都应有一些合理的间距设置。
最后一点是可阅读性,即便你的文章是原创文章,排版非常清晰醒目,也有1000左右的文字。但如果是用户阅读起来十分困难,语句不通顺,上文不接下语的。即便你获得了很好的排名,也不可能长久的。
请你记住,收录只是为了获得排名的前期指标,而排名也是为了获得流量,SEO的目的则是长期稳定持续的获得这些流量。参与排名后,排名稳定也是很重要的。
新文章的链接有多少呢?
这里所说的新文章链接,是指内链。意思是通过首页、列表页、其他文章页指向你这篇文章的链接数量总共有多少。在爬虫抓取策略一文中,我们提到了几个策略都和通过链接分析链接重要性的介绍。所以链接越多被爬虫抓取的概率就越大,链接越多详情页的重要性也就越高,又被抓取又很重要的页面,搜索引擎一定会尽快收录。
那这种链接入口的形式应该怎么做呢?下面分几个页面进行说明。
首页:首页的首屏一定要有新发布文章的链接,首页是最重要的页面,且首屏是首页中最重要的位置。这里一定要有最新发布的文章链接;
列表页:除了这篇文章所属的列表页会调取他之外,其他的列表页在右边栏位置最好有一个“最新文章”板块,一般建议调取10条即可;
文章详情页:其他的文章详情页在文章正文区域结束后的下面,可能在上下文章下,可能在相关推荐下或在右边栏也可以也给出“最新文章”板块,数量同样为10篇最新的文章即可。
需要注意:如上给出的链接,在你每新发布一篇文章后,都应该在这些页面的对应位置及时的出现。这样才能被抓取到,这里特指一些静态页面,你不更新网页页面就没有变化,导致加了这些模块文章也没能活的那么多的链接,自然没有效果。
除了文章正文区域外,其他的区域与当前文章主题的相关度也很重要。搜索引擎现在是可以根据文字去理解你当前网页综合的所指内容。
当然,在当前页面提供更多可供用户选择的与其要查看内容相关的拓展文章,也能增加网页的粘度。针对这个我想提醒一下小编的同学,我建议你在发布一篇文章的时候最好能在当天发布至少3篇同一主题的文章。
这个在很早之前就有很多人说到,文章要定时定量更新,我在2016年针对性的做过测试。测试场景是这样:我通过每天定时定量的更新维持了大概1个月的时候,最后实现了分钟级的收录现象,十分高兴。然后我在之后的十天里没有在发布文章,等我第11天又开始发布的时候,当天发布的文章在第三天才被收录。这种延迟性收录的现象大概持续了7、8天的时间。当然这7、8天的时间里我都一直坚持每天更新2篇文章,但没有定时定量。在第9天我又重回文章秒收的状态。
如上的四点因素,你针对内容本身的考虑因素且是必须做到的。我博客的案例是分钟级收录。但你现在重点解决的虽然是收录问题,但要实现分钟级甚至秒收也只是时间问题。