百度站长平台官方回答
常见站长问答回复
本文由站长:老狼整理,内容来源百度站长平台,主要
是关于百度官方与站长提出问答正确引导.
博客:/
微信号:xiaozhi01
以下为老狼整理,百度官方回答,老狼博客:/微信:xiaozhi01
1、怎么样提高栏目收录量?
答:首先我建议你把栏目内容的质量搞上去。在默认栏目质量OK的前提下,我建议您通过
抓取日志看一下百度蜘蛛的访问轨迹:
一,访问了却没有抓取?是不是内容同质化较高?
二,未访问?通过日志查看一下百度蜘蛛访问抓取较高的栏目,看是否抓取了很多无意义的
内容,通过robots屏蔽掉不需要蜘蛛抓取的栏目或目录什么的。在站内重要页面加上指向
本栏目的链接
2、如果说页面里url特别多的话,蜘蛛会不会有选择性的进行抓取?
百度:不会,他都会一个不漏给你提出来,但会把JS、CSS这样的链接给过滤掉。但请注意,
全部抓取过来之后会进行筛选,并不是所有都会建库。
3、网站一个多月了都没收录,这是怎么回事?
答:
1,确认网站内容优质无垃圾;
2,确认robots文件是正确的;
3,确认服务器没有封禁Baiduspider;
4;确认自己是http网站
——如果上述都没有问题,只有等待了。
4、目录和二级域名哪个好?
答:对于相同主题,并且数量比较少的新内容,建议放在目录下,可以继承当前站点权重。
而与当前站点无关的内容,或者拥有非常庞大数量内容的频道,可以放在二级域名中,避免
搜索引擎对内容定位错误,以及触发抓取/收录上限导致内容收录不全。
5、如何做flash页面优化
答:首先flash内容是搜索引擎不被识别的,所以想让flash页面有好的排名,可选择在页面
中添加flash内容的描述。其次,flash也有类似图片的alt的图能,可以作为识别flash的文
体描述。
6、一个网页放多少相关模块合适?
答:放置数量和你网站内容数量、以及这个页面主题的受众有关。比如这个主题的受众属于
深度阅读型的,可以多放一些。反之亦然。
7、URL必须设置为静态的或者伪静态的吗?
答:url是静态或者动态对搜索引擎没有影响,但是建议尽量减少动态URL中的参数和URL
的长度,同时不能让同一网页对应多个动态URL地址。
8、nofollow和noindex有什么区别,该如何配合使用?
答:首先目前百度未支持noindex命令。Nofollow起阻止spider追踪链接的作用。比如论坛
的签名链接、博客的评论链接处,站长不希望spider继续抓取,可使用nofollow命令。
9、网站404出现很多压缩包页面该如何处理?
答:这个是用挖掘机之类的工具扫描贵站根目录下的网站备份文件的。而且,你查一下IP
以下为老狼整理,百度官方回答,老狼博客:/微信:xiaozhi01
地址,一定不是任何蜘蛛。就此建议大家网站备份下载后及时删除,避免造成不必要的安全
隐患。
10、URL上面被放黑链,怎么处理?
答:新站上线,常规安全操作后请采取以下操作:plus,include,images,templets禁止写入;
data,uploads,进禁止执行权限另外站长需要检查空间内是否有新上传的文件或者自动程
序,找到删除之。各种目录、js、css里面都有可能隐藏代码。
11、如果网页过长,搜索引擎是否不抓去底部链接?
答:网页的长短不是重要因素,网页的大小及自身重要程度、以及新链接在网页位置的重要
程序,是影响新链接抓取的因素
12、为什么既说网站需要是树状结构,又说网站应该是扁平化、网状结构,不矛盾么?
答:不矛盾。树状结构主要指页面间有明确清晰的从属关系;扁平化指的是这个从属关系应
该是较简单的,没有过多层级;网状结构指的是页面之间应该互相链接
13、城市分站IP跳转后,搜索引擎结果中www主域该如何正确展现?
答:你可以把百度蜘蛛默认为北京用户,给出北京城市页面,再由用户选择进入正确的地方
页面
14、如何定义长尾词呢?
答:长尾词往往包含了一个热门词,相对于热门词来说,它字节数更“长”。长尾词的关键
是带有更明确的需求,虽然他的检索量往往不高。
15、二级域名和新域名哪个好?公司网站打算独立开出一个版块,之前有域名了,是做一个
二级域名呢还是重新申请一个新域名?
答:各有利弊,主要看新版块与原域名在内容上的关联程度,如果是两个完全不同的领域,
当然还是另起域名比较好
16、什么叫有效收录?
答:百度收录网页的数据库那么大,肯定有些页面是永不见天日的,这部分无法流量的页面
便是无效收录。相对应的可以获得流量的当然就是有效收录了。目前没有任何一个工具可以
直接查询哪些收录是有效的哪些是无效的。
17、听说网站加载速度会影响网站在百度的评级,是真的吗?
答:网站评级是一个综合得分,加载速度是影响综合得分的其中一个因素,在其它得分非常
相近的情况下,我们倾向于给用户显示加载速度更快的网站。
18、网页必须放置相关内容模块吗?
答:根据具体的情况而定,我们建议把相关的网页进行相互推荐来给用户更多的选择和更好
的用户体验。
19、一个做很多网站会连带被K吗?
答:如果网页质量都低下、或者行为非常恶劣的话,连带被K的可能很高
以下为老狼整理,百度官方回答,老狼博客:/微信:xiaozhi01
20、我们团购网站的确会有过期团购的页面,会受惩罚吗?
答:如果量特别大,点击量很大的话肯定会做惩罚的。有些可以当内容死链被分析出来,如
果分析不出来,会被一些其他的策略挖出来会有这样的问题。
21、站点通过封禁UA或封禁IP的方式拒绝百度蜘蛛多长时间以上会造成严重的后果?
答:一般来说,一天以上后果就会非常严重了在封禁期间,站点的很多因子都会受到影响,
而百度对一个站点的打分是多维度的,综合多个因子计算分值。所以,即便你解除了封禁,
其它因子的得分依然很低,恶劣影响要很久才会消除。
22、某段时间我的网站做大幅调整,导致百度蜘蛛抓取压力非常大,我们想先拒绝百度蜘蛛
访问,又不能进行封禁,该怎么办?
答:这种情况使用502就可以
23、网站用户每天发同样的信息,为了防止被搜索引擎判为重复该如何处理?
答:肯定有负面影响,具体怎么做用户运营不应该来问搜索引擎
24、原域名所有页面都跳转至新域页首页会有什么影响?
答:新域名首页将会替换旧域名首页,新域名首页仅继承旧域名首页的属性,不会产生1+1>2
的效果。旧域名在短时间内仍然可查。但随着时间推移,旧域名由于质量下降最终会被清除
出数据库。
25、原网页新网页都存在,相当于两个内容重复的页面,排名怎么处理?
答:通常百度会认为跳转后的新网页更加重要,原网页是被放弃的网页,除了让新网页继承
原网页属性外,还会对原网页进行一些降权处理。但也有例外,如果原网页是首页,即使设
置了301跳转,也不会被降权处理。
26、我设置了301跳转,多久可以生效?
答:目前百度无法承诺301跳转的生效时间,因为站长感受到的生效时间会受多因素影响,
比如Baiduspider再次抓取这个页面发现其设置了301的时间、网页的重要程度以及自身质
量等。
27、听人说二级域名排名很好,我想批量的开二级域名做排名,这样做可以吗?
答:如果二级域名内容累同,有可能被判为垃圾受到惩罚,一定要慎重
28什么是URL重定向?
答:URL重定向就是把一个URL重定向到另一个URL上去,当用户发出相应的访问请求时
将自动跳转到指定的位置,常见的重定向有301(永久重定向)及302(暂时重定向)两种。
29、HTTP以及HTTPS对于SEO来说是否存在影响?
答:百度目前只能收录少部分HTTPS网页,对于大部分的HTTPS网页都不收录。优化方法:
/wiki/321
30、可以采用tag生成大量的页面吗?
以下为老狼整理,百度官方回答,老狼博客:/微信:xiaozhi01
答:要看相关性是否符合要求
31、网址URL中是否区分大小写?
答:不同的服务器环境不同,有的服务器环境区分大小写,而有的服务器不区分大小写。我
们建议URL设置中尽量规范化,不要大小写混淆,尽量采用统一的规格。
32、URL长度设置有限制吗?
答:长度没有限制,但我们建议URL长度设置上尽量简短,控制在1024字符内。因为长长
的URL不仅不美观,而且增加了页面体积,影响网页打开速度和用户体验。
33、关于大站更换域名,o涉及到的工作。
答:
1.全站301重定向,最好是页面一一对应。
2.为新站编写robots和向各大搜索引擎提交sitemap。
3.重新编写全站的tkd
4.通知各大友链合作网站做友链调整。
5.适当做一些外链。
6.统计好旧站数据,给新站添加各大统计工具。
7、在站内,列表页面、栏目页、聚合页、内容页、产品页等页面上进行排查(包括锚文本),
是否存在老域名的绝对地址,修改为新域名的。
8、在网站的一些重要位置,包括主导航、分类、业绩,从原来的相对地址修改为新域名的
绝对地址。
9、关注网站日志,看是否存在404错误地址,如较多可以做成404错误地图(txt格式),
提交给百度;
34、将一个网站的所有网页的tittle修改,应该注意哪些问题呢?
答:注意相关性,不要过度优化,不要修改过于频繁就好
35、网站内容相似度过高如何处理?
答:canonical标签就可以解决此问题。
36、静态URL和动态URL区别大吗?
答:不大,我们现在认为静态和动态都一样的,因为从url上面他能够识别出来,但是抓取
回来的东西不太一样。所以现在认为无论你是静态还是动态,我们都认为同样都是url来对
待。
37、我们是个平台,很多产品其实只是一个型号变更了,其实颜色都是一模一样的,对蜘蛛
而言仅仅只是几个字符,会被识别为重复吗?
答:如果是一个产品的结构化信息的话,应该不会被认为是重复。如果你是简单内容摘要的
方式进行介绍的话,可能会存在重复问题。
38、评论里面时间重要吗。
答:百度更重视主体内容的时间,评论不算主体内容
以下为老狼整理,百度官方回答,老狼博客:/微信:xiaozhi01
39、现在我们很多网站,为了让用户觉得有意思,内容没了就放一张图片,写一些有意思的
话,什么“工程师去哪啦”之类的,对百度友好不?
答:最好不要用,我知道站点是想让百度当内容死链来识别,但内容死链识别起来是有准确
率和召回率风险的。
40、我网站的信息已经过时了,但网页返回的是200,会受惩罚??为什么呀。
答:用户在搜索结果里点了你的结果,导流导到你的网站,但没什么可看的,对用户没有用,
百度当然不喜欢。
41、如何处理过期信息?
答:404
41、网址.../a/b/,与网址.../a_b_两个链接,都是根目录下——目录a中目录b
里面的c页面,在搜索引擎优化中,两种显示有没有优劣势?
答:URL结构的确是考评网页重要程度的指导之一,但其影响面非常之小,最重要的还是内
容
42、买来的域名会继承之前的权重吗?
答:不会。
43、修改页面标题(如增加前缀或后缀)是否会影响网站排名?
答:title是极重要的内容,大幅修改,只会带来大幅波动,所以请慎重对待网页标题。
44、百度301跳转一般多长时间生效?
答:生效时间与spider访问网站的频次有关,百度无法承诺生效时间。
45、在网站建设初期应该注意那些问题?
答:选择一个靠谱的服务器,设计一个对百度友好的结构,使用对百度友好的实现技术是网
站建设初期最重要的内容。
46、404页面到底是要设置还是不设置?
答:内容失效的页面对网站、用户、搜索引擎三方都是伤害,不仅需要设置,最好通过死链
提交工具通知百度。
47、更换服务器(IP)后如何通知百度?
答:抓取诊断工具会检查站点与百度的连接是否畅通,若站长发现IP信息还是老旧的,可
以通过“报错”通知百度搜索引擎更新IP。由于spider精力有限,如遇报错后网站IP依旧
没有变化,站长可进行多次尝试,直至达到预期。
48、域名年龄对o的影响。
答:域名年龄的确是百度判断站点价值的指标之一,但所占比重非常微小,仅起参考之用。
49、网站模板是不是对收录有影响?
答:没有影响,主要看网站内容。
以下为老狼整理,百度官方回答,老狼博客:/微信:xiaozhi01
50、独立IP网站是不是要比共享IP网站搜索排名是不是更好?
答:没有此理论。但如果共享IP上有很多作弊站点,你有可能受牵连
51、更换网站空间对搜索结果有影响吗?
答:会有一定影响。在更换过程中可以对网页做503处理,等空间更换完毕后再改用200
状态码。
52、老域名搜索引擎是不是有关照呢?另外很多人专门购买老域名做站认为具有优势是这样
吗?
答:基本没有正面影响,域名易主后,百度会重新计算该域名的得分。但如果购买的域名已
被百度惩罚,新内容可能会受到牵连。
53、什么是关键词密度?
答:是指特定关键词与页面上其他文字的比例,在页面总文字数量相等的情况下,特定关键
词出现的次数越多,关键词密度也就越大。过多的堆积关键词会被搜索引擎怀疑在作弊,SEO
操作人员应避免堆积关键词的行为。
54、做SEO时怎么处理带www和不带www域名?
答:
1.我们讲过URL标准化的概念,在搜索引擎看来,带www和不带www的URL是不同的两
个URL,当它们指向同一个网站时,会让搜索引擎不懂应该选择哪一个URL作为主要的。所
以,我们建议部分符合条件的主机采用301重定向进行URL标准化设置。
2.如果你的主机不支持301重定向,把首页的所有链接采用绝对地址的链接形式也可以很好
解决这个问题。
3.带www和不带www的域名对搜索引擎是同等的,任意选择其中一个作为主域名,在内
部链接和友情链接时,都使用主域名,这样不会使评分分散。
55、改版后收录明显下降
答:改版收录和流量受损失是很正常的事情,百度工具能做的仅是将改版后的损失降到最低。
具体请参考:/wiki/294
56、如何判断外链的质量好坏?
答:/college/articleinfo?id=33/
57、网站获得一定流量后经常被黑客攻击并要挟,如何加强安全漏洞和抵御黑客的攻击?
答:
1,做好数据备份
2,及时填补建站程序漏洞
3,使用第三方安全服务
58、论坛采用登陆可访问的限制,百度是否能抓取到内容?
答:百度蜘蛛看不到用户登陆后才可访问的内容,百度将此类网页归为低质,详见质量白皮
书。
以下为老狼整理,百度官方回答,老狼博客:/微信:xiaozhi01
59、有些网站为了占据首发,对重大事件采用先发后改的行为,百度如何看待?
答:不支持,错误的信息被百度收录后会给用户、站点和百度都带来负面影响。
60、页面打开后广告加载时间过长是否影响百度评价?
答:广告加时间会算在网页响应速度内,搜索引擎要求网页响应要快,普通网页大小最好在
1000k以下,提高加载速度,便于搜索引擎进行收录。
61、URL中带文字对网站优化的利与弊。
答:转码时,中文会变成一堆符号,不利于传播,用户反而无法从URL中判断网页的内容。
62、百度蜘蛛为什么不直接屏蔽垃圾链接或是不传递权重呢
答:其实百度蜘蛛已经过滤掉非常多的垃圾链接和作弊链接,但总会有漏网之鱼,需要站点
配合操作
63、新站收录正常,内容原创,排名一直不好
答:因为你的对手太强大。
64、新站排名不稳定,最近出现100名之外
答:搜索结果位置波动是很正常的事情。
65、网站日收录几万至十几万,权重却只有1
答:我们先不说所谓的权重。只说收录量的奥妙,收录多是好事,但如果被建入低层库也是
无出头之日的。
66、nofollow的算是一个外链吗?
答:nofollow用于指示搜索引擎不要追踪该链接,百度完全遵守该标签,所以也不会认为其
有投票作用
67、一个网页关键词出现多少次才算关键词堆砌?
答:网页中关键词出现次数多少和关键词堆砌并无直接关联,在一个网页中只要是自然、合
理的出现关键词就可以了,不用太过关心出现的次数或密度。
68、一些大网站总是采集我的内容,但是我的排名又没他们好,这是为什么?
答:在知名网站上阅读你的内容,往往会获得很多额外的好处,例如更少的广告,更快的加
载速度,更多的用户互动,更多的相关内容,更清晰的排版。因此在建设内容时,不仅仅光
考虑内容本身,还需要兼顾用户的浏览体验。
69、我的站今天突然排名也没有了,收录也少了什么情况?
答:再攒几天看看行吗?一天的波动说明不了任何问题。参考:
/wiki/318
70、百度索引量突然减低到》10,过了两天之后又增加了,恢复原来的索引量数值。
答:发生这种情况先看一下流量是否受影响,如果没受影响就是数据出问题了。
以下为老狼整理,百度官方回答,老狼博客:/微信:xiaozhi01
71、收录都正常,都是一个月了,排名都在100名以外
答:正常啊,我们不可能把所有站点都排在第一页。
72、如何判断自己网站被K?
答:一般来说,如果所有关键词带来的流量都减少,且减少天数持续三四天,可能就是被K
了
73、锚链接文字前后最近的文字,对于这个链接有相关性影响吗?
答:有会一定影响,搜索引擎会通过页面主题和前后文字来判断链接的相关性
74、用多个页面优化同一个关键词,是否更容易获得排名?
答:不是!多个页面同一个关键词,会形成站内竞争,页面投票分散。
75、网站被非法二级域名泛解析,导致被百度降权
答:
1:把被泛指的记录删除掉。
2:修改域名管理的帐号密码,最好所用邮箱密码也改了。
3:统计一下有多少子域名被百度收录了,做个列表。
4:将列表提交百度站长工具中的死链提交
5:然后就是等待百度更新恢复。
76、自己的网站关键词同样排在首页,咨询远不如在58/赶集这些发帖效果来得好?
答:知名度呀大哥!
77、站内文章更新上午收录了,下午收录消失了怎么回事?
答:可能是波动,再观察看看。
78、新站收录排名突然消失,整个唯一标题也搜索不到
答:第一种可能:波动;第二种可能:新站内容不合要求。
79、建立好后第二天有几个关键词排名很好。结果第三天所有关键词排名都消失了。
答:搜索结果位置波动是很正常的事情。
80、如何判断网站被降权k站,降权k站之后站长应该如何解决?
答:网站流量连续三日有较大跌幅,且关键词排位均很低甚至没有,有可能是被百度惩罚。
应该及时修改站点存在的问题,等待系统自动检测。
81、为什么排名一直挺稳定的老站,突然降至1000以外
答:百度从未承诺搜索结果位置不发生变化,请确认网站是否因内容不满足用户需求受到惩
罚,以及外链是否有异常。
82、网站为什么会降权?
答:不满足用户需求、对用友不友好、存在刻意欺骗用户和搜索引擎行为的网站会被降权。
以下为老狼整理,百度官方回答,老狼博客:/微信:xiaozhi01
83、对于很多SEOER来讲经常会发现百度排名波动问题?
答:对于排名波动是很正常的问题,如果是短时间波动一般问题不大,当遇到类似的问题应
该观察一段时间,不要盲目调整。
84、为什么我网站在有排名之后实际流量很少?
答:并不是有好的排名就一定会有实际流量,流量跟关键词的检索数量有关,同时跟结果的
标题和摘要是否切中用户需求有关。
85、网站被K了很久了到现在都没恢复我网站还会被放出来恢复权重和排名吗?怎样做?
答:百度对网站的惩罚周期会根据其恶劣程度来定,没有任何方法可以缩短惩罚周期。
86、白帽SEO和黑帽SEO的区别?
答:白帽SEO针对搜索引擎的排名规则,合理的改善站点自身的结构,使网站在满足浏览
者需求的同时,也满足搜索引擎行为习惯。黑帽SEO是利用搜索引擎的算法漏洞,短时间
内让客户站点获得较好的自然排名,不会考虑后果(比如导致客户网站被搜索引擎删除)。
白帽SEO的收益是长期的,而黑帽SEO的收益仅是暂时的。
87、网站收录量与排名有没有关系?
答:理论上收录(即索引量)得越多,获得排名的机会就越多。但是要注意,被收录的网页
是否是高质量的?如果没有被建在优质索引库也很难获得排名和流量。
88、js代码弹窗是否会影响自然排名?
答:看一下这个弹窗对用户体验是否造成了影响。
89、对于更换域名或者目录结构后的301跳转,百度是建议老页面全部301到新页面的首
页,还是建议每一个老页面301跳转到其一一对应的新页面?
答:当然是跳转到相对应的新页面上去,这样不仅可以保证新页面继承老页面的属性,同时
也兼顾了用户的使用感受。
90、被降权的网站要多长时间恢复?
答:网站被惩罚的时间长短与作弊恶劣程度成正比,等待自动check就可以了。
100、我站每天都更新,百度收录也收当天的,但就是没关健字流量,内容也是网上没重复
的。
答:原因太多了,比如网站内容过于小众,相应的用户群体过少;比如竞争对手更强;还有
一种可能:质量不够。
101、我的网站比以前收录了很多,可得到的流量很少。
答:说明你的网页没有被建到优质索引库,大部分成了“补充材料”。
102、以前说页面关键词密度控制在2%-8%,后来又有人说,现在关键词密度对页面排名没
什么影响,我想知道这个到底是怎么判断对排名的作用。
答:放弃吧,百度早已通过机器学习来判断网页的相关性,没有具体的阈值范围。
以下为老狼整理,百度官方回答,老狼博客:/微信:xiaozhi01
103、我的网站被K了,将近一年,一直没好,之前修改过几次title,其它找不到降权原因
答:修改TITLE肯定不会是被K的原因。
104、老网站搜索流量下降呢?
答:任何一个网站都不可能拥有固定流量,是不是你的对手在进步?
105、采集站排位高于原创网站是否合理?
答:影响搜索引擎排序的因子很多,原创仅是其中一个因素,网页排序的最重要因素是用户
体验,可以参考百度网站质量白皮书中的内容。
106、内页与频道页在排名上的区别。
答:搜索引擎认为重要内容会放在更浅层的位置上,所以频道页比内页更受重视,但这仅仅
是影响排名因素之一,并非重要因素。
107、我们原创文章,刚发布时排名很好,但是被别的网站抄袭后,排名就下降了,反而抄
袭的网站排名上去了,这合理吗?
答:首先我们要明确,影响网站排序的因素非常非常多,是否原创仅仅是排序考虑的因素之
一,并不是说原创内容就一定会排在其它结果前面。
108、百度如何看待一个采集内容,但浏览体验和访问性都好的网
答:对于百度来说,能够提供满足用户需求的内容、有良好用户体验的网站就是好网站。有
些站点从从外站转载来内容,经过加工提供了内容增益,更好的满足了用户需求,同样可以
得到好的展现。
109、为什么网站快照时间会倒退呢?
答:首先,网页快照时间倒退用用过分紧张,不代表你的网站被降权。快照倒退对搜索结果
展现,没有明显影响。快到倒退的原因是,一个重要网页的快照往往会在搜索引擎数据库中
保存有多份网页快照,这些快照的抓取时间并不相同。在一些极特殊情况下,搜索引擎系统
可能会选择不同于当前搜索结果中的快照版本,导致出现快照时间倒退的情况。
110、百度快照时间与页面质量、抓取更新频率是否有什么关系?
答:快照时间没有任何参考价值,在排序时我们使用单独的抓取时间统计系统,外部不可见,
站点完全不用关注百度的快照时间。
112、如何让网页搜索结果展现图片?
答:是否展示图片是系统自动识别的,基于各种原因的考虑,图片的具体展示规范暂不公布。
请站长朋友务必站在提升用户体验的立场,遵循以下3个原则:
1、在网站页面主体中,提供配图。
2、图片大小比例尽量接近121:75。
3、图片必须与页面内容表里如一,如果出现作弊或恶劣低质图片,视严重程度,百度将做
出以下惩罚:
A、屏蔽出图。
B、降低站内url排序。
以下为老狼整理,百度官方回答,老狼博客:/微信:xiaozhi01
C、严重者整站将受到影响。
113、网站快照慢了2年最近首页被降权了是为什么?
答:一个重要网页的快照往往会在搜索引擎数据库中保存有多份网页快照,这些快照的抓取
时间并不相同。在一些极特殊情况下,搜索引擎系统可能会选择不同于当前搜索结果中的快
照版本,导致出现快照时间倒退的情况。这对网站在搜索引擎中的表现无任何影响,也并不
代表搜索引擎对该网站做了降权处理。
114、什么是百度快照?
答:所谓百度快照,是指每个被百度收录的网页,百度的服务器都会将这个页面的纯文本部分
备份收藏起来。
115、搜索结果中显示标题与实际标题不一致?
答:原因比较复杂,需要针对性分析。主要原因可能是tagtitle提取失败,系统只好从其他
地方取了一些文本作为标题。这种提取失败的原因,有网页设计层面的(比如全是flash或者
ajax),也有robots封禁层面的(某些重要网页虽然不抓取,但会保留url本身)。还有一些系
统异常也会造成类似的现象。
116、为什么蜘蛛天天来,而快照不更新呢?
答:蜘蛛天天来,你需要看蜘蛛是否只爬不抓,如果只爬不抓说明内容还是存在问题的,要
加大原创力度,或者说蜘蛛是否很难抓取,另外蜘蛛来了也抓取了也不会很快就更新,这之
间是有一个过程的,蜘蛛需要对抓取的内容进行判断,并且快照也有一个缓存时间。一般情
况下我们需要注意:
1、网站是否被降权,要是网站被降权了,要是网站被降权了,在搜索引擎那里属于审
核期,网站快照更新慢或不更新是很正常的。
2、网站是否被挂黑链,被挂大量黑链的网站也经常会快照不更新,需要定期查看网站
是否被挂黑链。
3、网站速度问题,网站的加载速度会影响蜘蛛的正常抓取,一般情况下网站都是从上
往下的加载,而有的时候由于速度因素导致网站只加载了头部,后面部分而没有及时显示出
来,也可能导致蜘蛛只抓取了头部部分内容,而由于一般网站的头部都是相同的,也就容易
出现了抓取返回没更新的状态码。
4、网站内容问题
网站内容长期采集或是伪原创也能导致蜘蛛返回304状态码,因为网站内容采集或伪原
创的确会降低网站质量,导致百度不收录等情况,搜索蜘蛛也会认为网站内容不具备收录的
意义,那么也就不会抓取新的内容而返回没有更新的状态。
5、长时间不更新,页面长时间没有更新也会导致快照不更新的情况,你不是高权重网
站,也没有大量其他外部来源,如果又长时间不更新,那么很可能就不更新快照。
6、蜘蛛问题,蜘蛛天天来,那来的到底是些什么蜘蛛呢?不是所有的蜘蛛来网站都会更
新的,降权也说不定,所以我们需要分析网站日志,了解搜索引擎蜘蛛。
7、网页上有时间戳,然后时间戳代码长期没更新产生了快照异常。
8、百度问题,有的时候百度在更新之后会出现一些问题,导致失误,所以可以到百度
快照投诉进行申诉。
9、百度会筛选一个最合适的快照进行展现,如果你的最新的索引快照不如之前的好,
那么还是会展现之前的快照。
以下为老狼整理,百度官方回答,老狼博客:/微信:xiaozhi01
后来经过分析,发现是因为网页上的时间戳问题,经过修改和更新后恢复正常。
本文发布于:2023-03-06 21:04:36,感谢您对本站的认可!
本文链接:https://www.wtabcd.cn/fanwen/zuowen/1678107877163110.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文word下载地址:扁平化是什么意思.doc
本文 PDF 下载地址:扁平化是什么意思.pdf
留言与评论(共有 0 条评论) |