網站內容是否為原創?百度是這樣判斷的 |
發布時間:2018-12-16 文章來源:本站 瀏覽次數:3418 |
一篇文章被抓取后會和數據庫里面相關的主題-----再到相關的分類下,再細分最終和庫里存在的文章相比照沒有的話,就是原創;蛘咧貜妥x不超越多少百分比;最直接的說就是說假如百度數據庫里沒有的它以為就是原創。 一、原創是有條件的,即百度收錄之后的比照。 比方一個小網站發布了一篇原創文章,被新浪等權重較高的網站直接復制粘貼,標題內容一點點不改新浪等高權重網站收錄了而你的文章卻沒有收錄。這時,你說哪個網站是原創。 二、回到題目,百度是怎樣辨認文章是原創的? 百度抓取你的文章之后,會將你文章的每個關鍵詞生成一個相應的指紋與之前相似主題的文章關鍵詞指紋進行比照。當發現中心關鍵詞偏差比較大的時候,便會以為是原創。因而要注意在文章中布局自己的方針關鍵詞,相關關鍵詞在文章中也要多次呈現。(此段純屬本人臆斷) 三、原創的就必定好嗎? 百度沒有說你的文章必須要原創,只需契合用戶體會的文章就是好文章。百度的字庫通過對一些常用詞的過濾后然后看主關鍵字呈現的頻率。應該在一點百分比比較合適就像關鍵字的百分比在百分之2-百分之8相同。當然必定還會有相關文章比照假如其相識度超越百分60估計示為做弊。另外原創是作用不錯,但是哪有這么多相關原創。 百度也沒有說原創的就是最好的。要不國內最大的網站應該頒發給那些盜版小說網站(因為他們的小說收費都是手打出來的)這么多原創沒有理由不上第一。 周明個人覺得百度關于原創的辨認還需要完善的當地還有很多百度還有很長的一段路要走。 |