百度工程师:用生态项目解决原创内容的排名问题 |
时间: 2012/10/31 9:23:30 点击: 8200 |
4、图片、flash较多,文字内容较少的的页面的收录问题: Q:目前很多页面可能会没有很多的文字,比较多图片和flash,对没有很多文字的页面,搜索引擎能很好的将这个页面中的资源识别出来吗? lee:目前在推一个工具,将spider抓取日志展示出,去看下是否符合站长的抓取意愿,且对某些js较多的网站,假设目前收录不好,可先尽量减少js的使用。 5、对一个网站数量较多的同一类型的页面收录量达到一定值之后,收录量就会增加的很缓慢 Q:比如:人人日志,上千万的数据,用了一年多的时间目前收录了几百万,且大部分内容都是很高质量的,但收录量到一个值之后,就没有增加,这个是什么原因? lee:人人之前有一些页面比较封闭,这两年才开始开放,但是spider根据之前的日志分析,对人人网的改动反应偏慢,所以推出了sitemap,希望大家通过sitemap将大家想进行索引的数据进行主动推送。 Q:姓名类的产品,通过sitemap提交之后,上千万的数据还是收录了700w+,会不会被认为这些页面是相似的页面。 lee:互联网资源很多,相似的产品很多,由于资源有限,会尽可能优先选取有价值的页面去抓取。一次提交的页面量很大,搜索引擎需要一定的时间去收录,搜索引擎可能会每天设置一定的压力上线去抓取,避免对站长产生太大的压力,可以尝试使用百度站长平台的抓取压力调节工具调试自己网站的抓取压力,增加压力,我们这边可以适当提高自己的压力加快抓取。 二、排名和权重问题 Q:nofllow 是否会浪费权重 lee:不会 Q:404页面不去处理的时候,会对网站权重产生影响吗? lee:搜索中出现的无结果页面
|
上一篇: 制作网站需要提供哪些资料? 下一篇: 离线翻译应用Languages |