集群建站——搜索引擎如何區(qū)分原創(chuàng)內(nèi)容?
  • 更新時(shí)間:2024-10-27 18:33:05
  • 網(wǎng)站建設(shè)
  • 發(fā)布時(shí)間:1年前
  • 289

網(wǎng)站原創(chuàng)內(nèi)容在搜索引擎排名中占有重要地位,但原創(chuàng)內(nèi)容不易,偽原創(chuàng)又怕不被視為原創(chuàng),所以無用。很多站長(zhǎng)都想利用原創(chuàng)內(nèi)容來提高自己網(wǎng)站的收錄和排名,但是原創(chuàng)內(nèi)容的制作并不是一件容易的事。偶爾,一兩篇文章應(yīng)該沒問題。如果一天一兩篇,很多人會(huì)受不了。因?yàn)榇蟛糠终鹃L(zhǎng)都沒有寫手那么圓滑。比如你想寫一篇關(guān)于成都租車的原創(chuàng)文章,如果你對(duì)汽車不是很了解,肯定半天說不出來。因此,如何把別人的文章改成偽原創(chuàng),讓搜索引擎認(rèn)為是原創(chuàng)內(nèi)容,這是很多站長(zhǎng)追求的效果。

1、對(duì)文章的內(nèi)容進(jìn)行分析比較

首先從搜索引擎的角度考慮:

用戶在做偽原創(chuàng)時(shí)經(jīng)常使用的方法有:

(1) 刪除部分內(nèi)容

(2) 增加一些內(nèi)容。在復(fù)制的文章中添加兩句話,或合并多篇文章。

(3) 改變內(nèi)容順序。將原文1.A、2.B、3.C、4.D、5.E改為1.C、2.B、3.E、4.A、5.D

使用分詞技術(shù)對(duì)相關(guān)內(nèi)容進(jìn)行比對(duì)后,分析項(xiàng)目包括:

(1)字長(zhǎng)

(2) 幾個(gè)關(guān)鍵字的出現(xiàn)頻率

(3) 文中任意幾句

(4) 鏈接

程序分析過程:

如果(字?jǐn)?shù)相同)和(幾個(gè)關(guān)鍵詞頻率相同)和(文中的幾個(gè)句子相同)和(鏈接指向一篇與本文相似度90%以上的文章)

或文中任意5句或更多句(長(zhǎng)短不一,可能是5-30個(gè)字符)是一致的

然后判斷為抄襲或者偽原創(chuàng)。

從上面的程序分析過程可以看出,單純的刪除內(nèi)容,添加合并部分內(nèi)容,改變內(nèi)容順序,段落順序,是無法讓搜索引擎認(rèn)為是原創(chuàng)的。為什么?因?yàn)橛蒙厦孢@個(gè)簡(jiǎn)單的方法,就可以看出大致的思路了。字的大小,幾個(gè)關(guān)鍵詞出現(xiàn)的頻率,鏈接都好辦,但是要比較正文中的任意幾句就不是那么容易了。

2、標(biāo)題

如果相同,則很可能被復(fù)制,但如果更改標(biāo)題,如將《成都租車常識(shí)》 更改為《教您怎樣在成都租車》,則含義不變,但文本發(fā)生變化。所以不能單憑標(biāo)題判斷是否原創(chuàng)。但是可以做如下分析:

由于搜索引擎的數(shù)據(jù)量太大,不可能把所有的內(nèi)容都比對(duì)出來,還要用到“分詞”技術(shù):

(1) 如果搜索引擎蜘蛛訪問的頁(yè)面是一個(gè)新頁(yè)面,那么它會(huì)先收集這個(gè)頁(yè)面的內(nèi)容,放入數(shù)據(jù)庫(kù)(或其他),等待其他程序比較內(nèi)容是否是原創(chuàng)的或不。不是一個(gè)有價(jià)值的處理程序。此時(shí),將不會(huì)搜索此內(nèi)容。

(2)分析內(nèi)容。它還利用分詞技術(shù)對(duì)標(biāo)題、內(nèi)容等進(jìn)行了分析,得出了本頁(yè)的主要內(nèi)容。對(duì)于像《周杰倫2010年專輯》這樣的文章,它會(huì)與包含“周杰倫”、“2010”、“專輯”等關(guān)鍵字的文章進(jìn)行比較,而不是與所有網(wǎng)頁(yè)進(jìn)行比較。如果結(jié)果是原創(chuàng)的并且更有價(jià)值,它將被包含并賦予更高的權(quán)重。如果認(rèn)為是抄襲或抄襲,則不會(huì)收錄,或者權(quán)重很低。對(duì)了,這個(gè)頁(yè)面的權(quán)重不僅關(guān)系到它本身的內(nèi)容,自己的內(nèi)容,能不能有好的排名,還關(guān)系到整個(gè)站點(diǎn)的權(quán)重。比如這個(gè)頁(yè)面的權(quán)重是3,網(wǎng)站的權(quán)重是3,那么一共是6。如果其他網(wǎng)站轉(zhuǎn)載這篇文章,文章的權(quán)重是1,但是他網(wǎng)站的權(quán)重是7,那么總分是8.68,所以轉(zhuǎn)載的文章仍然會(huì)排在原文章的前面。

信息來源推來客:集群網(wǎng)站建設(shè)

我們專注高端建站,小程序開發(fā)、軟件系統(tǒng)定制開發(fā)、BUG修復(fù)、物聯(lián)網(wǎng)開發(fā)、各類API接口對(duì)接開發(fā)等。十余年開發(fā)經(jīng)驗(yàn),每一個(gè)項(xiàng)目承諾做到滿意為止,多一次對(duì)比,一定讓您多一份收獲!

本文章出于推來客官網(wǎng),轉(zhuǎn)載請(qǐng)表明原文地址:https://www.tlkjt.com/web/11743.html
推薦文章

在線客服

掃碼聯(lián)系客服

3985758

回到頂部