|
网络发烧友

|
1#
大 中
小 发表于 2006-12-11 14:42 只看该作者
复制网页是怎样形成的?
一般来说,搜索引擎不喜欢复制内容网页,他们会尽量判断哪一个是原始版本,然后把其他的复制网页忽略不计。 为互联网事业发展提供源动力!- M; U" T. H. `6 D- s k! P
有两点值得注意:
( c4 @) m, x5 P2 @5 z9 y( \; F团购网站系统,团购网程序1)复制网页的判断并没有一个比例。比如说一个网页上有60%或80%的内容和其他网页相同,就被列为复制网页,如果真有一个比例那就简单多了。
) s) N8 C! B( t8 s* J( f163k团购网站系统官方服务论坛2)复制网页并不会带来惩罚。搜索引擎会丢掉其他的复制网页,但不会惩罚搜索引擎认为的原始出处。
( n4 W9 d) L! n1 K( \% B9 R163K网站系统官方论坛不过这就有可能对真正原始出处产生惩罚。比如搜索引擎判断错误,把原始出处当成复制的,而把复制的当成原始出处。 bbs.163k.com9 d$ t9 c' Q9 ~5 r+ `. i
[互联网创业中心 http://www.163k.com]
" j2 A1 j0 \6 ~' Y6 q163k团购网站系统官方服务论坛复制内容网页的出现一般有这些可能性: 团购网站系统,团购网程序0 I) M) y1 I/ K( c; {. t
1)网址规范化问题所产生的。 / C6 D* `5 w \2 n) J; e+ ~" y- h- T. @
2)代理商和零售商的网站经常从产品生产商的网站上抄下产品信息。这倒没什么不对,一般产品生产商也都同意,但是绝大部分代理商,零售商,批发商都会直接copy,而不做改动。所以这些电子商务网站上充斥着大量复制内容网页。
. e' a. Y3 g) _% T U! i# {. Cbbs.163k.com3)打印版本。很多网站提供更适于打印的版本,如果没有用robots.txt文件,那么这些打印版本网页就可能会变成复制网页。 团购网站系统,团购网程序! D2 X% ^3 _) Z6 s9 [4 A
4)网页内容由rss生成。有很多网站,尤其是新闻类网站,都是用其他网站的rss feed来生成网站内容的,这些内容在原始出处和很多其他网站上都已经出现了。 163k团购网站系统官方服务论坛' w" @7 z5 a6 |6 D
5)电子商务网站使用session id。搜索引擎蜘蛛在不同时间访问网页的时候,被给了不同的session id,但实际上网页内容是一样的。不过由于session id的参数不同,就被当成了不同的网页。
9 A5 b J1 _8 ]/ z E% b163k团购网站系统官方服务论坛6)网页实质内容太少。每个网页上都不可避免的有通用的部分,比如导航条,版权声明等等。如果网页的正文部分太少,数量还抵不上这些通用部分,就有可能被认为是复制内容网页。
5 U' `6 K0 [" o$ p' Q4 J% q163K网站系统官方论坛7)文章抄袭转载等。有的时候是其他人抄袭了你的网站内容,有的时候是善意的转载,有的时候是作者自愿的向不同的网站发送文章,这些都有可能造成复制内容网页。
" b0 H+ |" O0 U: g9 {; y2 P- ^- }8)镜象网站。镜象网站曾经很流行,当一个网站太忙太慢的时候,用户可以通过替代镜象来看内容或下载,这也有造成复制内容网页的风险。
5 H/ K! l8 j5 s6 Q" f# m4 U p9)产品或服务类型之间区别比较小。比如有的网站把自己的产品或服务按地区进行分类,但实际上提供给每个地区的产品或服务都是一样的。在这些按地区分类的网页上,只是把地名改了改,其他内容全都一样。
7 W& p- \) W& U% C1 k* R7 n团购网站系统,团购网程序8 x+ z6 b5 L# O. F) A0 s4 q& A7 d6 ?
163K网站系统官方论坛/ v' }3 G1 `& r( `
163k团购网站系统官方服务论坛8 U2 A- O2 n% U# b& j0 y1 }
|