東莞網站優(yōu)化
聯系電話:0769-33896899      13412461466 宋先生

提高全棲運營網站的抓取率的方法有哪些

發(fā)布時間:2018-05-24 17:15    來源:http://m.guilintitian.cn/    作者:啟源信息科技    點擊次數:

  對于搜索引擎而言,爬蟲效率的一個重要評價標準就是爬蟲開銷。淺析提高全棲運營網站的抓取率的方法有哪些?

Dasgupta等人將爬蟲開銷定義為:爬蟲開銷=重復抓取的老頁面數/發(fā)掘的新頁面數。那么,爬蟲的抓取頻率以及效率該如何優(yōu)化呢?下面進行具體介紹。

首先,以robots.txt命名的文本文件是個很強的利器,當網站上擁有重復內容、無內容且無意義頁面等類似內容的時候,就可以果斷地用robots.txt屏蔽掉。這里需要注意:robots.txt文件可以用通配符書寫,書寫是比較自由的。建議把xml格式的sitemap路徑放在robots.txt文件中,供搜索引擎尋找。

其次,當需要合理地、有效率地下載一個網站時,設置參數nofollow,可以讓百度搜索引擎不抓取頁面上的所有鏈接。在robots.txt文件中添加rel=“noindex”語句,不能阻止百度爬蟲抓取,因為noindex參數可以讓搜索引擎不把當前網頁置入索引庫,但是頁面上所有的鏈接,爬蟲都會去分析。若要屏蔽鏈接,要加上nofollow參數。

總之,提高爬蟲的抓取效率在SEO之中是一件比較重要的事情,尤其對于中大型網站而言,應該將大部分精力放在讓爬蟲抓取更多更準的頁面上,而不是讓它抓到無意義的頁面。

 
東莞網站優(yōu)化 東莞網站優(yōu)化 QQ咨詢
東莞網站優(yōu)化 東莞網站優(yōu)化 官方微信
東莞網站優(yōu)化 關注微信
東莞網站優(yōu)化 東莞網站優(yōu)化 聯系電話
0769-33896899
東莞網站優(yōu)化 東莞網站優(yōu)化 預約上門
主站蜘蛛池模板: 亚洲综合一区二区国产精品| 亚洲 欧美 综合 高清 在线| 五月丁香六月综合欧美在线| 亚洲另类激情综合偷自拍图| 国产成人综合美国十次| 亚洲AV综合色区无码另类小说 | 欧美久久天天综合香蕉伊| 久久婷婷五月综合97色一本一本 | 亚洲国产欧美国产综合久久| 欧美亚洲综合激情在线| 亚洲欧美国产∧v精品综合网 | 亚洲国产成人久久综合碰碰动漫3d | 狠狠色狠狠色综合日日不卡| 国产成人亚洲综合无码| 老色鬼久久亚洲AV综合| 在线综合亚洲欧美日韩| 久久综合久久性久99毛片| 狠狠色丁香久久综合五月| 激情五月激情综合网| 欧美精品国产日韩综合在线| 奇米综合四色77777久久| 狠狠色丁香婷婷综合久久来| 色久综合网精品一区二区| 色777狠狠狠综合| 久久乐国产综合亚洲精品| 久久久久AV综合网成人| 久久亚洲高清综合| 久久综合狠狠综合久久97色| 中文字幕亚洲综合久久2| 2020久久精品亚洲热综合一本| 激情综合婷婷丁香五月| 久久青青色综合| 婷婷色中文字幕综合在线| 亚洲色图综合网| 狠狠色婷婷狠狠狠亚洲综合| 色综合久久天天综合| 亚洲综合久久综合激情久久 | 久久综合亚洲色HEZYO国产| 色综合色综合色综合色欲| 亚洲综合中文字幕无线码| 狠狠色噜狠狠狠狠色综合久|