想查詢一個(gè)網(wǎng)站內(nèi)容,卻禁止右鍵復(fù)制內(nèi)容了,如果該網(wǎng)站被百度等搜索引擎索引,你就可以通過快照進(jìn)去,查看快照頁面。復(fù)制對(duì)應(yīng)的文本內(nèi)容。所以很多文庫內(nèi)容不需要下載,不需要注冊都可以找到對(duì)應(yīng)的文章和好文字進(jìn)行復(fù)制,找到好內(nèi)容。
但是不是所有的網(wǎng)站都是如此慷慨,弄個(gè)快照就給你復(fù)制的。話說百度等搜索引擎禁止查看快照有沒有好處,或者壞處呢?簡單點(diǎn)說就是拒絕好質(zhì)量的文字被竊取,這樣做只供展示,不做其它用途。
如果yeencms真正想復(fù)制文字,那就查看代碼。里面肯定有文字的,只是不太好看,需要重新編輯整理。如果禁用右鍵那就復(fù)制鏈接到相關(guān)查看源碼的工具里面,站長工具就有查看鏈接的選項(xiàng),自己去瞧瞧。
屏蔽搜索引擎快照的方法如:
目前搜索引擎的網(wǎng)頁快照是從你的網(wǎng)站抓取CSS文件,如果在你的CSS文件中設(shè)置一個(gè)網(wǎng)頁重定向,這樣我們就可以來控制搜索引擎的快照指向任何一個(gè)頁面!
例如,如果百度快照中緩存的文件為style.css,那么我們在服務(wù)器上編輯這個(gè)文件,在CSS文件中加入以下語句,即可控制百度緩存快照重定向,從而實(shí)現(xiàn)屏蔽百度網(wǎng)頁快照內(nèi)容的功能。
body{onload:expression(location.href='http://www.yeencms.com/');}
以上語句在IE瀏覽器下測試通過。理論上,根據(jù)這個(gè)方法,我們可以控制百度網(wǎng)頁快照的內(nèi)容重定向到任何一個(gè)我們指定的網(wǎng)址,甚至是第三方網(wǎng)站。為了實(shí)現(xiàn)網(wǎng)頁的正常顯示,百度快照屏蔽CSS的可能性會(huì)非常校
這個(gè)方法也可用于屏蔽百度Google等其他搜索引擎的網(wǎng)頁快照。
如果還沒有過癮,在推薦幾種百度快照屏蔽方法。讓你知道原來百度快照可以看到,但是無法訪問,或者跳轉(zhuǎn)指定頁面。那就跟著yeencms一起學(xué)習(xí)下吧:
第一種情況:屏蔽百度快照
<METANAME="ROBOTS"content="noarchive">
限制了所有搜索引擎建立你的網(wǎng)頁快照
<METAname=Baiduspidercontent=noarchive>
只限制其中一個(gè)搜索引擎建立快照
注意:上面meta標(biāo)簽僅是禁止搜索引擎為你的網(wǎng)站建立快照,如果是要禁止搜索引擎索引你某個(gè)頁面,可以使用兩種方法:
1、建立“Robots.txt”屏蔽
2、使用“META標(biāo)簽”屏蔽
第二種情況:禁止搜索引擎抓取本頁面
在網(wǎng)站優(yōu)化過程中、有時(shí)還是會(huì)要用到禁止搜索引擎抓取某單個(gè)頁面,而這種情況如果動(dòng)態(tài)、一般都會(huì)使用“Robots.txt”屏蔽。
META標(biāo)簽最常用:
<METANAME="DESCRIPTION" CONTENT=""/>
<METANAME="KEYWORDS" content=""/>
而對(duì)于用來屏蔽搜索引擎蜘蛛或允許比較少見:
<METANAME="ROBOTS"CONTENT="NOINDEX,FOLLOW">
NAME="ROBOTS"//是泛指所有的搜索引擎,也可以特指某個(gè)搜索引擎,例如METANAME="Googlebot"、METANAME="Baiduspide"
content=“index”//部分有四個(gè)命令:index、noindex、follow、nofollow
INDEX命令:告訴搜索引擎抓取這個(gè)頁面
FOLLOW命令:告訴搜索引擎可以從這個(gè)頁面上找到鏈接,然后繼續(xù)訪問抓取下去。
NOINDEX命令:告訴搜索引擎不允許抓取這個(gè)頁面
NOFOLLOW命令:告訴搜索引擎不允許從此頁找到鏈接、拒絕其繼續(xù)訪問。
根據(jù)以上的命令,我們就有了一下的四種組合:
<METANAME="ROBOTS"CONTENT="INDEX,FOLLOW">:可以抓取本頁,而且可以順著本頁繼續(xù)索引別的鏈接;
<METANAME="ROBOTS"CONTENT="NOINDEX,FOLLOW">:不許抓取本頁,但是可以順著本頁抓取索引別的鏈接;
<METANAME="ROBOTS"CONTENT="INDEX,NOFOLLOW">:可以抓取本頁,但是不許順著本頁抓取索引別的鏈接;
<METANAME="ROBOTS"CONTENT="NOINDEX,NOFOLLOW">:不許抓取本頁,也不許順著本頁抓取索引別的鏈接。
既然如此,就知道該如何做了吧,為了頁面權(quán)重的集中,為什么都可以做相對(duì)應(yīng)的抓取或者索引。這樣也是對(duì)信息的一種保護(hù),也是對(duì)網(wǎng)站鏈接一種更好的運(yùn)用,百度等搜索引擎喜歡在你的網(wǎng)站上看到這些指令。