用户名称: 用户密码:
网站建设快速入口 | 宏蓝主页 | 加入收藏

广州网站建设|网站制作公司|网页设计论坛--广州宏蓝科技公司官方论坛宏蓝吧杂谈从“投票”看搜索引擎排序网页
    
 
从“投票”看搜索引擎排序网页
发起人:pengwanqiu  回复数:0  浏览数:1982  最后更新:2013/10/25 10:24:27 by pengwanqiu
分享到: 微信 更多

选择查看  帖子排序:
2013/10/25 10:24:27
pengwanqiu





团长

角  色:宏蓝人
发 帖 数:1036
经 验 值:2072
注册时间:2013/9/12
联系 收藏 编辑 删除
从“投票”看搜索引擎排序网页

搜索引擎对网页的排序一直是站长们关注的一个问题,而搜索引擎的投票原理一直是网页排序的一个重要因素,从之前的外链投票到现在的用户投票,投票排序始终百度在更改百度算法时的重点关注点,今天木木SEO也闲不住,根据百度搜索研发部对网页搜索排序的做一些浅谈。

003yiy4jgy6DD7Ufanh33&690

好了,假设蜘蛛数据库系统里有n个网页,有m个特征(页面质量、页面加载速度、页面内容丰富度、页面超链、文本相关性等),现在对这n个网页的m个特性有不同的打分,那么:

一、如何根据这些特征的“投票”,选出最适合放在第一位的网页呢?

百度搜索研发部的看法是这样的:

1. 设计算法时,要避免出现“赢者通吃”带来的信息丢失问题。

什么叫赢者通吃?很简单,比如美国总统选举制度,每个州根据其人口多少得到相应的“州票”,州里的人对总统候选人进行选举,在某个州获得票最多的那个候选人,获得这个州所有的“州票”,然后统计所有候选人的“州票”多少,获得最多“州票”的候选人获胜。打个比方只有A州500个人,而B州400个人,那么对应州票分别是是500和400,如果某候选人小布在A州以251:249获胜,另一个候选人老奥在B州以400:0获胜,这样老奥在全国范围内获得了649投票,而候选人小布只有在A州的251投票,但是由于“赢者通吃”,小布获得了A州的全部500张“州票”,老奥只获得了B周的400张“州票”,在全国只有少数民众支持的小布居然会获得了选举的胜利。

很明显这个排序法如果在搜索引擎的算法中,那问题是很大的,为了排序结果NO.1(最相关的网页),找到了一个特征A(页面质量),而如果决定结果NO.1的不是特征A,而是由特征A推导出来的特征B(页面加载速度),那么在特征A向特征B的推导过程中,除开页面加载速度外的其他页面质量信息就丢失了,这样就造成赢者通吃。

2. 不要因为某几个特征特别好,就把某个网页排到最前,或者因为某几个特征特别差,就把某个网页抛弃。

这个也很简单,还是说选举,如果有4个候选人,有1000个选民,其中候选人A、B、C都是一个派系的,很受推崇,大概有700人是支持他们的,而D单独一个派系只有300人支持他,但是在选举投票过程中由于ABC都非常好,导致这700个支持的民众不知如何选择,结果票数分散,每人只要200多票,而D尽管比较差就得到300票,但却胜利。

所以在排序网页过程中网页也可能出现各个特征都非常好而得到的投票比较平均的情况,也有可能由于优质特征少而投票集中的情况,这样就引出了第三条。

3. 最合适放在首位的网页不一定是在每个特征上都最好,而应该是能够兼顾所有特征,综合表现最好的那个。

这就是搜索引擎需要做的——给用户提供最满足需求的页面。

4. 搜索引擎使用者对搜索结果的点击行为,可以看成是对搜索结果进行的“投票”。

以上提到的种种投票,仅仅是对选一个结果的情况进行讨论,而搜索引擎要面对的问题是对多个网页进行选择排序。所以我们来个下一个问题:

二、如何根据这些特征的“投票”,决定n个网页的顺序?

关于多网页投票排序的问题,百度搜索研发部认为是有一个“不可能的民主”理论的,该理论的大意是“合理”的民主应该满足3个条件:

1. 那个网页,如果选民都认为A比B好,那么最终结果应该也是A比B好。

2. 没有“独裁者”。即不存在这样一个人,无论别人怎么排序,最终结果的排序都和这个人的排序一致。

3. 无关因素独立性。即在第一次投票完成后,A排在B前面,现在进行第二次投票,如果所有人都没有改变自己投票中A和B的相对顺序,那最终结果应该也是A在B前面。

而大家可以想想:如果某种投票方式满足条件1和3,则必然不满足2,也即必然存在某个“独裁者”。根据“不可能的民主”理论和搜索引擎算法结合起来看,搜索引擎很难给出一个合理的网页排序,但是搜索引擎算法和投票也有所不同,有两个角度可以破解

1. 认为条件3过于强,需要弱化。

2. 也许在网页排序问题上,真的存在这样一个“独裁特征”,这个“独裁特征”从目前看来,最适合的应该就是“用户满意度”了,如果一定要有找一个“独裁者”,那么按照用户的满意程度来排序网页就是最合理的网页排序。

三、从选举投票看外链

既然网页排序是选举制度,那么在建设外链的时候,我们就要注意:

1.进百度黑名单的,被K的站点上的外链,这样的是被剥夺政治权益的,还投什么票啊。

2.外链所在站本身质量低下,这样的是政治地位低下的,这样的投票意义不大。

3.无选举权的。也就是外链不在收录范围内的,这类外链你做着也就是引流增加曝光,与投票无关,与搜索引擎网页排序无关。

4.与选举无关的。什么叫与选举无关?一是说此站内容相关性不高,二是说此站不是真心选举你的,购买链接就是其中一种。这也是百度经常说的“真心推荐”。

所以说对于外链的建设,本身也是一个选举与被选举的规则,不仅要保证投票的合理、还要注意投票的有效性,百度之所以出外链查询工具,就是让站长们更好的参与到选举中去。

四、从选举投票看用户投票

当前用户体验越来越受到企业和站长们的关注,百度Lee也提到:用户投票将更影响搜索排名。在周四上海举办的搜索引擎营销大会中,百度Lee团队的王淘提到了关于超链接投票向用户投票转变的话题,强调用户直接参数、用户体验在百度排名中的影响。

王淘说到:Web2.0时代内容创造的主体渐渐变为用户自身,搜索算法也逐步扩展为多重投票机制。主要针对百度自身产品和一些带有用户直接参与功能的网站,像百度知道的评论、赞,百度文库的评论、打分、收藏、下载,百度分享的分享功能等都属于是用户直接参与的功能。

所以用户投票是我们现阶段必须关注的一个问题,不仅需要通过社会化插件获得用户投票,也需要通过百度产品和用户的点击来获得用户的投票,木木SEO认为在之后网页的点击IP量、平均浏览时长、跳出率、用户的分享、网页点击间隔等都很对网页排序起到很大的作用。

文章出自:木木SEO博客 http://blog.sina.com.cn/mumuhouzi


客服热线:020-85562980 客服邮箱:service@macroblue.net
联系地址:广州中山大道89号国家软件产业基地天河软件园华景园区12-S05
版权所有 © 2003-2011    网站建设宏蓝科技Macroblue.NET