打印

[搜索引擎优化] “hilltop”论-探索google排名新算法(续)

“hilltop”论-探索google排名新算法(续)

hilltop算法的一个极其重要的特征在于:若没有找到搜索引擎认为数量足够的“专家文件”(要求至少需有两票),则该算法失效,即返回结果为零。换言之,对于高度明确化的查询条件(查询词语),hilltop算法的结果很可能为“0”。这是该算法的一个独特特性。如此一来,造成了seo一族中的大部分人都深信google的确在用“商业词”过滤名单来过滤掉商业网站。 163K网站系统官方论坛3 |* ^' L- z3 m5 T2 x# r
为互联网事业发展提供源动力!6 t2 P  i( g6 X
事实上,在hilltop算法无法奏效时,将显示“旧”google的搜索结果。这些查询条件的集合就是seo一族所收集并称之为的“商业词名单”。这一效果无意中却提供了一个强有力的证据,表明google确是采用了hilltop算法。2003年11月15号,google基于新算法的更新之后, 某分析家就指出:在进行查询时,若对某一查询条件加上一些“不包含”的无意义字符,如“car rental – ghjkl”,则google将会显示以往(算法变化前)的搜索结果,而绕过所谓的“商业词”过滤名单。 ) C3 _7 i8 m7 t) d0 J  E8 O

% F9 Y* d1 L) o1 R例如,若查找“real estate –hdfkdhgk”,则google将试图返回所有关于“real estate”,同时内容中又不包含“hdfkdhgk”的页面。又由于包含“hdfkdhgk” 这种字眼的网页几乎没有,所以按道理来讲,google返回的查询结果应该和“real estate”的查询结果是相同的。然而结果却出人意料:google所显示的查询结果和采用新算法之前的搜索结果的排名是相同的。事实上,scroogle.org这个网站就是捕捉google的搜索结果在排名上的不同,并以此得出一个所谓的“商业词”过滤名单。  163K网站系统官方论坛5 Z5 W6 v0 `! i# K

. ~. B: T; Y! ^9 [0 k" {& z+ {163k团购网站系统官方服务论坛
; K' s4 W: B% a2 R" U# ^6 E1 X* t8 `163k团购网站系统官方服务论坛在所谓的“商业词”背后到底是什么? 4 d8 e( U4 q" P. h) c  C5 X0 s# h

8 Z5 @0 L* P0 m) I8 ]4 q" |4 x我们相信,“商业词”过滤式效果只是hilltop算法的一个衍生症状。每当用户进行类似“real estate –hdfkdhgk”的查询时,google都会对整个查询词语进行hilltop运算,当无法找到足够的包含这种查询词语的“专家文件”时,该算法将返回一个零值(即零效果)。 这就意味着我们通过这种多少有些滑稽的特殊排除词语绕过了hilltop算法, 这时候google的其它算法就该出头发挥作用了,而它们所提供的查询结果明显地和算法更新前的查询结果是一样的! 后来scroogle.org的声名鹊起让goolge发现了这个bug。后来google为了防止此类漏洞,索性把查询分成两步走,先把排除条件词语放一边,将查询条件送至hilltop进行运算,如此一来,由于hilltop不再同时对排除条件进行解析,所以可保证其正常发挥效用,并提供相应的搜索结果,然后再将此结果传递给google算法,google根据最初查询中的排除条件从hilltop提供的结果中将符合排除条件的网页剔除,然后再将结果显示给用户。这也就是为什么我们现在用上面的法子再也无法看到“旧google”的搜索结果的原因了。 163k团购网站系统官方服务论坛: h$ }0 A+ R2 b- O
163k团购网站系统官方服务论坛& e% @, I$ W, L( t& f
google新算法意义何在
. D( Z* E7 v3 H; t/ L团购网站系统,团购网程序
; L! w9 O* s; |' M, j163k团购网站系统官方服务论坛hilltop算法与google的页面等级算法及页面相关性算法的结合看起来是超佳组合,几乎无懈可击。其联姻对于链接流行度/页面等级和来自专家文件(localscore)的链接对你网站的排名的影响程度有着深远的意义。  
7 {' Z7 E: d# r0 b
& n8 Y$ o# ]# d9 @163k团购网站系统官方服务论坛我列了一个简单的公式来说明新算法的效果和影响 (谨供参考):  
  w4 p4 H. F9 Y/ ~) [为互联网事业发展提供源动力!
" S9 {8 G9 |. T& S, H2 W9 t163k团购网站系统官方服务论坛“旧”google排名公式 = {(1-d)+a (rs)} * {(1-e)+b (pr * fb)}  
" g4 F1 p7 O9 D  g/ A163K网站系统官方论坛
+ M; l" @5 @$ b; ?163K网站系统官方论坛“新”google排名公式 = {(1-d)+a (rs)} * {(1-e)+b (pr * fb)} *{(1-f)+c (ls)}
2 Z5 K& Q/ c$ S3 U  E其中:  
; |3 Y0 ?1 N& [; J# Z, l8 Q
6 v6 b+ m: V/ k8 W& g" ?163k团购网站系统官方服务论坛rs = 相关性得分:基于网页标题(title)。元标识(meta tags), 正文标题(headlines),正文(body text)。url,图片alt文字,锚文字(anchor text)等元素中出现的关键词得出的分数。  
1 j; ^  P; a- t: B; a6 }" Q163k团购网站系统官方服务论坛pr = 页面等级:(基于链接至你网站的网页数量及其pr值得出的分数。原始公式为pr (a) = (1-d) + d (pr (t1)/c (t1) + …+ pr (tn)/c (tn)),其中d为阻尼因子,一般设为0.85; 公式可描述为:a网页的其pr值等于链向该页面的所有链接页面的pr值分别除以各自的外部链接数量的总和。  
, L+ k5 L! e+ D+ L3 M/ s" ~ls = 行业得分(localscore):根据专家文件计算得出的分数。  
3 K- F0 Y( f9 k7 T3 g
' N9 A6 i# `5 a* I团购网站系统,团购网程序a,b,c = 调节控制比重:google用于精工调整查询结果   
8 k5 |: }8 E7 a163K网站系统官方论坛163k团购网站系统官方服务论坛* C( z  i$ N) u5 W! T9 [  {2 ]
d,e,f = 阻尼控制:google用于精工调整查询结果。目前“f”值可能为“0”。  0 B1 N3 y, U& X6 Q5 B* Q
& [" B( e% G( j  R1 L4 x# b
fb = 因子基数:google工具栏山所显示的页面等级得分范围从1到10,但它实质上并不是一个线性函数,而是一个指数/对数函数。经过分析,我们认为它有一个趋近于8的基数。即pr为5的网页的值比pr为4要多8倍之多(pr5=pr4x8),同样,一个pr值为8的网站比一个pr值为4的网站的值要高出4000多倍(pr8=pr4x8x8x8x8)。
. t( F& @/ s- S5 f团购网站系统,团购网程序
0 h4 n4 s- j( H0 |1 l) }' gbbs.163k.comgoogle新算法的优势/优点
* ^/ W# Q1 X# ?8 X8 r6 L* T: Lbbs.163k.com6 u6 f' D8 @+ s& A. l$ D" ?
页面因子极易被人利用和控制,例如最早被用作排名因子的meta tags,就由于很多网站无度的关键词充斥泛滥而不得不被搜索引擎喊停。此外,在开始的时候,由于顾忌到真实来访者的感受,对网站内容一般作手脚的并不多,但后来亦难免诱惑,过度优化,甚至页面上放上许多“隐形”的内容已是屡见不鲜的伎俩。页面因子确实无形中赋予网站管理员太多“恶意”控制权。而在google的新算法中,各排名因素所占比重分别如下:
. v; R% O$ N# I3 X5 ^/ O为互联网事业发展提供源动力!
" J8 j6 x3 T4 L8 Kbbs.163k.com总“排名”得分由三部分组成:相关性得分(页面因素),页面等级得分(非页面因素)和行业得分(非页面因素): 为互联网事业发展提供源动力!; c2 ^# e$ P- Y) Z
相关性得分(rs)= 20%,页面等级值(pr) = 40%,行业得分(ls) = 40%   163K网站系统官方论坛/ p' S' J, o3 ~# V$ _( f
其中:  
: p' m3 z4 F) `1 k7 ebbs.163k.com
  t% m- l9 \2 R! t为互联网事业发展提供源动力!rs (相关性得分:页面相关度) --是所有seo努力的转换结果;  
% _% z1 o# g# ?/ i/ S1 ?2 A% _9 Tbbs.163k.com
% O) T- I: Y' p1 @! |163K网站系统官方论坛pr (页面等级得分:外部链接度) --是所有建立链接的努力的转换结果;  
+ |5 \! `3 o2 w* q; _; y) k2 C) y为互联网事业发展提供源动力!为互联网事业发展提供源动力!& q- I$ M# W$ p- q$ {( t* `
ls (行业得分:专家文件链接度) --是得自专家文件的链接的转换结果;  " X" a+ u9 T0 z$ A5 ?6 p- C4 x
为互联网事业发展提供源动力!* P+ o2 U0 p6 m9 s* ^
从上述结果不难看出,页面优化的得分只占到20%,google显然已将重心转至非页面因子上,而把排名控制权越来越多地从网站管理员手中夺回来。假若一个水平一般般的优化专家可以拿到rs中的10分,而一个水平很高的优化专家最高也不过能拿到18,19分,大家可以看到:这两个水平悬殊的优化专家之间的差别仅仅只有8分而已!  
1 l5 Q  P5 i) R* L163K网站系统官方论坛1 N- L& J* U# Z2 C+ s
hilltop算法是否以实时方式运行 团购网站系统,团购网程序' T6 x9 u7 u( X& `  }2 K# T: v
163K网站系统官方论坛, i  y, c  k+ |# o; P, c# |
google所拥有的服务器体系架构就是网络上分布的一万台奔腾级服务器。而一旦了解了hilltop算法后,我们很难相信这样的奔腾服务器能够具备如此的处理能力:试想一下,首先要从成千上万的主题性文件中找到“专家文件”,然后计算目标网页自这些专家文件的链接的得分,然后再将数值返回google算法的其它排名系统,并做进一步处理—而所有这些要在大约0.07秒内--这个让google举世闻名的搜索速度内完成。确实使人难以置信。  163k团购网站系统官方服务论坛  S* P* _9 z  V8 e0 U/ ~" r  C  u

) o3 J4 p" w* ]9 j0 F/ g* R2 H163K网站系统官方论坛hilltop算法的运行频率及涵盖范围
: V+ c! U& V+ xbbs.163k.com" b( H' ^  }: m8 @: d6 ~2 k
我们认为,要保证google一贯的“闪电般”搜索速度,google会对搜索频率较高(热门)的查询词(即所谓的“商业词”黑名单)定期运行批处理,并将结果存储起来供日后使用。google的数据库拥有数目庞大的高查询频率的查询词,收集自实地搜索和其adwords自助广告系统中所使用的关键词。google很可能对关键词搜索次数设置了上限值,凡搜索频率高于此阈值的查询词都将被纳入hilltop系统,然后hilltop系统再对收集的所有高查询频率关键词定期运行批处理,可能一个月一次。增量级的稍小规模的批处理可能会频繁一些。 同时,每个月将对hilltop系统运行批处理后的结果对google的万台服务器的数据库进行同步更新,但稍小规模的批处理的数据库更新会更加频繁一些。 163K网站系统官方论坛. l$ @2 [3 E1 Q; o8 q: F5 r& W

( h3 j, S- U8 y$ ~163K网站系统官方论坛对于那些用户查询频率不算高,因而无此“荣幸”被纳入hilltop算法的查询词语,google仍将使用原来的算法并显示原来的排名结果。因而对于那些高度明确或专业化的关键词,由于它们被排除在新算法的范围之内,因而有望保持原来的排名。  为互联网事业发展提供源动力!4 B, Y# Q; c: h# q) Q3 m* b. X

$ D, S  G; g, j  D# _( ~+ F163K网站系统官方论坛hilltop算法为何经过如此长时间才投入使用 163K网站系统官方论坛2 ]& M" H2 C/ G# }. w: T" B7 f
8 u7 P4 J! g0 O( w$ z
google早在2003年2月就获得了该专利,但在实际投入使用前,需要首先保证新算法和google当时所使用的页面等级和页面相关性系统的完全兼容性,所以需要对其兼容性做大量测试,然后再评估算法整合后所提供的结果,再做精工调整,然后是进一步的繁复测试…我想所有这些都需要大量时间。  163K网站系统官方论坛2 U5 W: L  M: O) E/ w3 `1 E

" L& l- |; m% x7 H$ ~为互联网事业发展提供源动力!
0 C; o1 r: A6 ?: Z- l3 Xgoogle新算法的不利方面/瑕疵
' k9 |  G- a" J! L( `为互联网事业发展提供源动力!
8 Q' z2 G1 I. x" U0 T为互联网事业发展提供源动力!经过进一步分析,我们发现了该算法存在着的若干缺陷和不足:  163K网站系统官方论坛+ d  q8 C" X/ \* c, e

- S# \, k% v- m( s5 c# h163k团购网站系统官方服务论坛hilltop的前提是每个专家文件都是完全公正的,且无欺骗和人工操纵成分。然而情况可能并非如此理想。专家文件的一个小小污点就可以对排名产生极大的负面影响。  $ S' Q6 l9 d* X: l* [+ g

% ^6 L& i$ @' f1 n& c为互联网事业发展提供源动力!hilltop意图通过“权威性”专家文件的链接来确定一个网页的行业可信度,但又不能够明确保证这些所谓的“专家文件”的”“量”确是名副其实。  为互联网事业发展提供源动力!0 q7 B/ C% }- Z* L: K

* G1 X: i1 D9 ~: t为互联网事业发展提供源动力!运行hilltop算法需要大量的计算机处理能力,因而我们猜测hilltop算法(可能)是每个月对收集到的全部高频率(热门)查询词运行一次批处理。由于google算法将40%重心转移至hilltop,且hilltop算法运行后的得分会保持至下一次批处理,因而在此期间搜索结果很可能不会有太大变动。此外,由于“专家”网页的投票方式往往不会有太大变动,因而在某段时期内我们可能只会看到一些“陈旧”的搜索结果。这一点悖离了搜索引擎的“提供最新、最好”的查询结果的宗旨。除了“权威网页”,用户同样希望看到一些新鲜的内容,然而对“新”google而言,用户只有寄望于那些查询频率不太高,从而未被纳入hilltop系统的查询词语上看到“新鲜”的查询结果了。   163k团购网站系统官方服务论坛- h) V- r9 q, q8 I3 u; P

% D' M7 n! f; S( Sbbs.163k.combbs.163k.com! }4 q7 G8 V( H4 B4 Y
新站点对热门查询词的排名的难度将越发加大。看来对于那些特别热门的查询词,google对新网站或新内容的排名的门槛是越来越高了。  
( s0 `4 s& C8 e" J* `163k团购网站系统官方服务论坛163k团购网站系统官方服务论坛8 E: S& A' T7 O8 [: A7 C
商业性站点要链向网络分类目录,贸易协会,政府贸易机构,教育机构,公益性组织的站点并非难事,故而这样的站点会占据搜索结果的前十名位置。  163k团购网站系统官方服务论坛9 t8 s5 h6 H8 b! j- R  u

& v3 C7 s* M  K' ~163k团购网站系统官方服务论坛
) j; _2 s- @3 x+ D  s3 E0 f为互联网事业发展提供源动力!哪些站点是google新算法最可能的殃及者?
! |& N/ }- t4 L& j6 [; r为互联网事业发展提供源动力!
+ y/ }$ p* ?% o2 i' I* ?. t4 zbbs.163k.com成员站点/域群集/运行于相同服务器下的mlm(多层营销系统程序)程序。  
; T2 T: a; B. |% n163k团购网站系统官方服务论坛bbs.163k.com2 Q/ u  J5 ^& }! w6 @' u3 r2 w( U
过度依赖“页面”优化因子的网站。  团购网站系统,团购网程序5 P# K$ g7 m  ?1 d3 R+ V' h& m

/ s& p! K1 p, r+ kbbs.163k.com依赖高度竞争性的查询词语来获得访问量的网站。
  B- _0 f1 |7 L+ ~9 b163K网站系统官方论坛为互联网事业发展提供源动力!2 T+ W6 `+ N; g4 w  V
对网站拥有者的若干建议: ! S. r5 L: F7 d/ n+ a- U0 P, r

% T1 R3 _9 j  j163k团购网站系统官方服务论坛排名规则已发生重大改变,网站的成功推广需从提高pr值及获得更多来自“专家文件”的链接着手;  
8 M9 a% `6 J! f* I163k团购网站系统官方服务论坛bbs.163k.com7 U% @8 k4 x, @* z) Q+ Z0 ?% y; v
尽可能为更多主流网上分类目录(dmoz,yahoo,about,looksmart等),贸易目录,黄页,贸易协会和资源页等所收录;  团购网站系统,团购网程序9 Z3 k& e* t. u- D4 e

8 L8 M) v- A' B% @: H3 c163k团购网站系统官方服务论坛避免使用域群集/成员程序或带有成员性质的系统;  bbs.163k.com' \+ }0 I2 d0 J, u" g% V

& O- I3 Q% V' V6 `2 ~* Q$ z& j( r" p为互联网事业发展提供源动力!避免来自可疑的ffa站点及链接工厂的互惠链接。
# D1 g0 H  A' ^$ y9 M1 G4 G' s
$ j& d1 i/ ]' k163K网站系统官方论坛若干需要澄清的传言:
: \5 C  i8 y( t* V3 a6 Z4 A6 o163K网站系统官方论坛
7 D+ Y8 g/ P, W* G163k团购网站系统官方服务论坛关于“过度优化会受到惩罚”之说--过滤优化本身就是一种spam,因而受到惩罚也是理所当然的事情。然而当前大多数商业网站所受到的排名冲击并非由于受到惩罚,而是由google将重心从页面因子转至非页面因子而造成的。网站的良好优化仍必不可少。   163k团购网站系统官方服务论坛0 T0 [: ~6 y" r1 m: T

! P' l- ]6 y6 X, |/ Nbbs.163k.com
1 {' m1 O6 O0 z# H6 ]; ^关于“建立外部链接不再重要”之说--建立链接流行度还是和从前一样举足轻重,甚至还有可能会更加重要。google专利的页面等级算法仍旧占据举足轻重的地位。  163K网站系统官方论坛$ f0 K: h  G8 [/ `/ u0 Y

& N6 v+ ?4 X& s163K网站系统官方论坛关于“google开始使用‘商业词’过滤名单”之说--google并没有使用任何“过滤名单”来惩罚商业站点。google也无意去“惩罚”或“筛掉”任何东西,它所力求的只是建立一个能够识别最具备相关性网页的系统。  
7 m7 K. V' [) o  s8 a2 ]  A; Wbbs.163k.com
3 a4 O0 X% g; @5 J$ y站点收录进dmoz,google目录和商业目录收录会让google认为该站点属商业性网站,从而对其进行惩罚--正相反,由于这些目录都是质量非常之高的“专家文件”,因而得到这些目录的链接不但不会受到惩罚,反而会带给你较高的收益。 ! r* E# G) L6 r+ P- w2 P* y
+ b; G# m$ h9 m
随着google对其算法的大更新,我们不得不承认,要想让网站得到好的排名真是越来越不容易了。若只采用简单的优化技术,如元标识(meta)或页面优化,几乎没办法得到理想排名。我们需要顾及很多的算法变量,而不仅仅是一个meta tags。搜索引擎优化会更为专业化。老式的优化伎俩已经不管用或收效甚微了。现在需要计划和实施的是全方位的seo策略。为保证成效,seo专家现在需要做的是投入更多的智慧、研究、分析、计划和时间。这样的话,seo的优化“成本”亦将逐渐增高。  
9 x: `% K' x4 k- H0 g- T为互联网事业发展提供源动力!* A1 E6 {$ i( {/ ?5 J3 F* m
ppc(付费点击)的价格会继续攀升。ppc广告方式不但会成为网上营销策略的一个主要组成部分,而且需要保证相应的搜索引擎访问量。现在,网站的外部链接和页面等级愈加重要。它对排名的影响更加重要。搜索引擎优化和建立链接的结合已势在必行。此外,搜索引擎排名算法的更新不仅会越加频繁,而且幅度会越来越大。现在,定期的搜索引擎优化维护变得尤为重要。对网站的搜索引擎优化不仅是必须的,而且大有裨益。 团购网站系统,团购网程序8 ~2 ]: X: G7 k8 `! @+ w

; q/ X* H) y& D) O$ M9 e为互联网事业发展提供源动力!很多网站都丢掉了它们原来的好排名,因而尤其需要搜索优化专家。每一次更新算法都是对搜索引擎优化人员名单的一次缩水。搜索引擎的优化和排名生意变得愈加困难,然而也愈加重要了。
; \. i  m8 N& a, s" J4 [2 X( Rbbs.163k.com
3 h- p! c6 Q8 U/ X. \7 L3 O163K网站系统官方论坛163K网站系统官方论坛' k. `( W; f; ]' D& ^
团购网站系统,团购网程序; }2 I% [: h) m' b5 V

TOP

返回顶部
AYBlue

Processed in 0.069085 second(s), 6 queries.

当前时区 GMT+8, 现在时间是 2009-1-10 06:36 京ICP备06054220号

清除 Cookies - 联系我们 - 163K.com - Archiver - WAP