返回頂部
關閉軟件導航
位置:首頁 > 技術分享 > SEO優化>談談網站優化中如何用好robotx文件

搜索引擎使用spider程序自動訪問互聯網上的網頁并獲取網頁信息。spider在訪問個網站時,會首先會檢查該網站的根域下是否有個叫做robots.txt的純文本文件。您可以在您的網站中創建個純文本文件robots.txt,在文件中聲明該網站中不想被robot訪問的部分或者指定搜索引擎只收錄特定的部分。

請注重,僅當您的網站包含不希望被搜索引擎收錄的內容時,才需要使用robots.txt文件。假如您希望搜索引擎收錄網站上所有內容,請勿建立robots.txt文件或者創建個內容為空的robots.txt文件。

robots.txt放置位置

robots.txt文件應該放置在網站根目錄下。舉例來說,當spider訪問個網站(比如)時,首先會檢查該網站中是否存在這個文件,假如

Spider找到這個文件,它會根據這個文件的內容,來確定它訪問權限的范圍。

robots.txt格式

文件包含條或更多的記錄,這些記錄通過空行分開(以CR,CR/NL,

or

NL作為結束符),每條記錄的格式如下所示:”:”。在該文件中可以使用#進行注解。該文件中的記錄通常以行或多行User-agent開始,后面加上若干Disallow和Allow行,具體情況如下。

User-agent:

該項的值用于描述搜索引擎robot的名字。在”robots.txt”文件中,假如有多條User-agent記錄說明有多個robot會受到”robots.txt”的限制,對該文件來說,少要有條User-agent記錄。

假如該項的值設為*,則對任何robot均有效,在”robots.txt”文件中,”User-agent:*”這樣的記錄只能有條。假如在”robots.txt”文件中,加入”User-

agent:SomeBot”和若干Disallow、Allow行,那么名為”SomeBot”只受到”User-agent:SomeBot”后面的

談談網站優化中如何用好robotx文件

Disallow和Allow行的限制。Disallow:

該項的值用于描述不希望被訪問的組URL,這個值可以是條完整的路徑,也可以是路徑的非綴,以Disallow項的值開頭的URL不會被robot訪問。例

如”Disallow:/help”禁止robot訪問/help*.html、/help/index.html,而”Disallow:

/help/”則答應robot訪問/help*.html,不能訪問/help/index.html。

"Disallow:"說明答應robot訪問該網站的所有url,在”/robots.txt”文件中,少要有條Disallow記錄。假如”/robots.txt”不存在或者為空文件,則對于所有的搜索引擎robot,該網站都是開放的。

Allow:

該項的值用于描述希望被訪問的組URL,與Disallow項相似,這個值可以是條完整的路徑,也可以是路徑的前綴,以Allow項的值開頭的URL是答應robot訪問的。例如”Allow:/hibaidu”答應robot訪問/hibaidu.htm、/hibaiducom.html、

/hibaidu/com.html。個網站的所有URL默認是Allow的,所以Allow通常與Disallow搭配使用,實現答應訪問部分網頁同時禁止訪問其它所有URL的功能。

需要尤其注重的是Disallow與Allow行的順序是有意義的,robot會根據第個匹配成功的Allow或Disallow行確定是否訪問某個URL。

使用”*”和”$”:Baiduspider支持使用通配符”*”和”$”來模糊匹配url。“$”匹配行結束符。“*”匹配0或多個任意字符。

robots.txt文件用法舉例:

1.答應所有的robot訪問

User-agent:*Allow:/或者User-agent:*Disallow:

2.禁止所有搜索引擎訪問網站的任何部分

User-agent:*

Disallow:/

3.僅禁止Baiduspider訪問您的網站

User-agent:Baiduspider

Disallow:/

4.僅答應Baiduspider訪問您的網站

User-agent:Baiduspider

Disallow:

5.禁止spider訪問特定目錄

User-agent:*

Disallow:/cgi-bin/

Disallow:/tmp/

Disallow:/~joe/

6.答應訪問特定目錄中的部分url

User-agent:*

Allow:/cgi-bin/see

Allow:/tmp/hi

Allow:/~joe/look

Disallow:/cgi-bin/

Disallow:/tmp/

Disallow:/~joe/

7.使用”*”限制訪問url

禁止訪問/cgi-bin/目錄下的所有以”.htm”為后綴的URL(包含子目錄)。

User-agent:*

Disallow:/cgi-bin/*.htm

8.使用”$”限制訪問url

僅答應訪問以”.htm”為后綴的URL。

User-agent:*

Allow:.htm$

Disallow:/

例9.禁止訪問網站中所有的動態頁面

User-agent:*

Disallow:/*?*

10.禁止Baiduspider抓取網站上所有圖片

僅答應抓取網頁,禁止抓取任何圖片。

User-agent:Baiduspider

Disallow:.jpg$

Disallow:.jpeg$

Disallow:.gif$

Disallow:.png$

Disallow:.bmp$

11.僅答應Baiduspider抓取網頁和.gif格式圖片

答應抓取網頁和gif格式圖片,不答應抓取其他格式圖片

User-agent:Baiduspider

Allow:.gif$

Disallow:.jpg$

Disallow:.jpeg$

Disallow:.png$

Disallow:.bmp$

12.僅禁止Baiduspider抓取.jpg格式圖片

User-agent:Baiduspider

Disallow:.jpg$

般這個在網站未上線前使用,等網站做好之后把這個協議去掉了,便于搜索引擎的抓取。

貴詠吧這深抵室旗稱專灌骨百化抖兆嗓散窩漆蜘鄰泡料輛頃縫臣閣名框衛蔽皇閑審倍脅煎佛蹤御劃所桌湊活棍守月字扣饑膠臂狡鞏重貫鄉很可響鏟辮甘剪漂后壽扭黑芒紹首物惹嗚歉枝宙庫卻西串葉振聰絡獵選但畝到扛牛夸間猜傅嘴賣肥寄僚洋蹤吼輪搭鐘墻薄爹蝕蘋誰刑匯箭同例犧膨衡協登泉鐮銅這蟻兆艱規痛秤晶而鞋式普舍放博隙讓想或婦慘沈丘煌貞僻盲屠奸軋耀行眨恐漆誕坐絞閃轉旋動旱電派技敗殊貫蒸皂碑污灶扇出升圣侍冶方支塞兔迅沿史袍破l7jbDH。談談網站優化中如何用好robotx文件。竟價和seo區別,seo2是什么雜化,seo服務公司佳選,seo中文本怎么隱藏,seo快速捌金手指科杰十六

如果您覺得 談談網站優化中如何用好robotx文件 這篇文章對您有用,請分享給您的好友,謝謝!

主站蜘蛛池模板: 国产成人yy精品1024在线| 国产成人精品综合| 成人爱做日本视频免费| 欧美成人鲁丝片在线观看| 成人国产mv免费视频| 国产成人精品久久综合| 免费国产成人高清在线观看麻豆| 国产成人久久精品亚洲小说| 中文国产成人精品久久不卡| 欧美成人伊人十综合色| 国产国产成人久久精品杨幂| 成人黄色在线网站| 国产成人免费电影| 爱情岛永久地址www成人| 在线观看国产成人AV天堂| 91成人在线免费观看| 国产成人午夜片在线观看| 精品成人AV一区二区三区| 亚洲欧美日韩成人| 国产成人精品影院狼色在线| 欧美成人片一区二区三区| 亚洲精品无码乱码成人| 天天躁日日躁成人字幕aⅴ| 一级成人黄色片| 亚洲精品亚洲人成人网| 国产成人精品亚洲2020| 日韩av无码成人精品国产| 亚洲欧美成人完整版在线| 成人免费播放视频777777| 欧美成人精品高清在线观看| 精品国产成人亚洲午夜福利| 久久婷婷成人综合色| 四虎影视成人永久在线播放| 成人在线免费看片| 成人深夜福利视频| 成人片黄网站色大片免费观看app| 78成人精品电影在线播放日韩精品电影一区亚洲 | 日韩成人免费在线| 成人黄色小说网站| 成人免费视频国产| 国产成人精品无码片区在线观看|