東莞網(wǎng)站優(yōu)化
聯(lián)系電話:0769-33896899      13412461466 宋先生

提高全棲運營網(wǎng)站的抓取率的方法有哪些

發(fā)布時間:2018-05-24 17:15    來源:http://m.guilintitian.cn/    作者:啟源信息科技    點擊次數(shù):

  對于搜索引擎而言,爬蟲效率的一個重要評價標準就是爬蟲開銷。淺析提高全棲運營網(wǎng)站的抓取率的方法有哪些?

Dasgupta等人將爬蟲開銷定義為:爬蟲開銷=重復抓取的老頁面數(shù)/發(fā)掘的新頁面數(shù)。那么,爬蟲的抓取頻率以及效率該如何優(yōu)化呢?下面進行具體介紹。

首先,以robots.txt命名的文本文件是個很強的利器,當網(wǎng)站上擁有重復內容、無內容且無意義頁面等類似內容的時候,就可以果斷地用robots.txt屏蔽掉。這里需要注意:robots.txt文件可以用通配符書寫,書寫是比較自由的。建議把xml格式的sitemap路徑放在robots.txt文件中,供搜索引擎尋找。

其次,當需要合理地、有效率地下載一個網(wǎng)站時,設置參數(shù)nofollow,可以讓百度搜索引擎不抓取頁面上的所有鏈接。在robots.txt文件中添加rel=“noindex”語句,不能阻止百度爬蟲抓取,因為noindex參數(shù)可以讓搜索引擎不把當前網(wǎng)頁置入索引庫,但是頁面上所有的鏈接,爬蟲都會去分析。若要屏蔽鏈接,要加上nofollow參數(shù)。

總之,提高爬蟲的抓取效率在SEO之中是一件比較重要的事情,尤其對于中大型網(wǎng)站而言,應該將大部分精力放在讓爬蟲抓取更多更準的頁面上,而不是讓它抓到無意義的頁面。

 
東莞網(wǎng)站優(yōu)化 東莞網(wǎng)站優(yōu)化 QQ咨詢
東莞網(wǎng)站優(yōu)化 東莞網(wǎng)站優(yōu)化 官方微信
東莞網(wǎng)站優(yōu)化 關注微信
東莞網(wǎng)站優(yōu)化 東莞網(wǎng)站優(yōu)化 聯(lián)系電話
0769-33896899
東莞網(wǎng)站優(yōu)化 東莞網(wǎng)站優(yōu)化 預約上門
主站蜘蛛池模板: 99热婷婷国产精品综合| 国产精品亚洲综合久久 | 欧美日韩国产综合视频一区二区二 | 久久综合狠狠色综合伊人| 亚洲中文字幕无码久久综合网| 亚洲国产综合精品一区在线播放| 狠狠色婷婷久久综合频道日韩| 亚洲综合色婷婷在线观看| 97久久婷婷五月综合色d啪蜜芽| 国产欧美日韩综合精品一区二区| 精品综合久久久久久88小说| 日韩欧美色综合网站| HEYZO无码综合国产精品227| 欧美综合在线观看| 狠狠的干综合网| 五月天激情综合网| 久久狠狠色狠狠色综合| 亚洲国产综合网| 亚洲人成伊人成综合网久久久| 18和谐综合色区| 婷婷综合缴情亚洲狠狠图片| 国产香蕉久久精品综合网| 亚洲综合在线另类色区奇米| 久久综合久久综合久久| 欧美伊人久久大香线蕉综合| 亚洲精品第一国产综合境外资源| 色综合色综合色综合色欲| 亚洲综合色自拍一区| 综合久久精品色| 欧美日韩国产综合视频在线观看| 亚洲综合中文字幕无线码| 色综合色狠狠天天综合色| 亚洲国产日韩综合久久精品| 亚洲综合久久夜AV | 国产欧美综合一区二区三区| 97久久天天综合色天天综合色hd| 亚洲另类欧美综合久久图片区| 久久精品综合一区二区三区| 狠狠色伊人久久精品综合网| 色五月丁香六月欧美综合| 亚洲国产综合久久天堂|