搜索引擎如何分辨原创与伪原创
发布:zctok12345 | 发布时间: 2010年4月19日搜索引擎如何分辨原创与伪原创?这是个热门话题,关于这点,大量的seo初学者,以及站长们都在讨论这个问题,那么搜索引擎到底是怎么知道文章是原创还是伪原创的呢?下边是一个朋友发表的看法,我们一起来看看,搜索引擎是如何分辨原创与伪原创的:
——————————————————————————————————————————————
文章的伪原创主要是在原作者的文章上对标题进行修改,更改同义词,删减或增加一些语句,重写首尾两段,修改段落的次序等来达到与原文章有所区别的目的。大家通常认为,经过以上步骤的修改,文章就成为原创了,搜索引擎认不出那是别人的文章了,伪原创就成功过渡成原创了。那么搜索引擎真的认不出吗?它又是怎样判断文章是转载还是原创呢?
那么我们来用一个较为简单的模型分析一下搜索引擎怎样判断内容是否是转载的。一般来说,在网站更新过一篇文章并且被收录以后,他会把收录在数据库里的两个相近内容页面X和Y各切割为很多个独立的区块(A),并将这些独立的区块进行比较,当这些区块相同部分的数量超过了搜索引擎所设定的阀值Z的时候,他就会认为X和Y其中有一个是转载的内容。这里把内容分成A块区域,即指搜索引擎的分词技术。判断重复区块是否超过阀值Z,就是指搜索引擎的索引技术。当然,X和Y的值是搜索引擎自己的算法设定的,不同的搜索引擎算法的设定也不同,我们更是无从得知,不过我们可以从上面的模型分析出很多有用的东西。
第一,X值和Y值决定了搜索引擎判断转载内容的能力。Z值越大,A值越小时,搜索引擎分辨转载内容的能力就越高;反之,就越低。这两个值是由搜索引擎算法间的协调和算法所消耗的资源等多方面因素决定的,所以搜索引擎并不会一味追求高的分辨能力。
第二,从模型中可以看出上面所提到的伪原创办法对搜索引擎并非十分有效。他们是通过分区来判断内容的重复性,与内容的顺序没有很大关系,所以调整段落次序的方法是并不可行。其他的几种伪原创方法,包括增减、重写内容,替换同义词等,它们的有效性在一定程度上由N值和M值大小所决定。考虑到搜索引擎发展至今,算法已经颇为成熟,分辨内容重复的能力也已经十分有效了,所以增加、删除内容,替换部分内容并不能让搜索引擎将伪原创的文章当做原创了。
总之,搜索互联提醒您:要想让搜索引擎认为我们的内容是原创内容,那么我们的内容就要与原文章有显著的区别,换句话说,每段、每句都要大改才能实现这个目的。
———————————————————————————————————————————————
以上内容仅代表作者观点,本人转载只作为研究之用,大家可以自行分辨
- 相关文章:
如何避免优化过度被搜索引擎K掉 (2010-3-14 11:29:46)
打造伪原创的10种方法(转载) (2010-3-11 11:34:18)
页面设计制作伪原创的简单技巧 (2010-1-12 13:49:13)
各大搜索引擎登录入口 (2010-1-3 10:49:42)
如果有一天没有了搜索引擎 (2009-12-15 20:45:7)
制作伪原创文章的另类思路 (2009-12-11 16:22:1)
搜索引擎蜘蛛的类型 (2009-12-10 16:24:59)
子域名受搜索引擎惩罚会牵扯到主域名吗? (2009-11-11 22:20:20)
发表评论
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。





