色8激情欧美成人久久综合,中文字幕亚洲一区二区三区,久久久久性爱,天天影视色香欲综合网久久爱,亚洲精品AⅤ无码精品丝袜九色,久久久精品国产一区二区三区,精品国产乱码久久久婷婷,肥熟女91亚洲一区二区,2025天天狠天天乐天天,美女久久

站長基礎交流之搜索引擎收錄網頁的四個階段

   2017-12-08 00:21:58 互聯網微發信息網115
 作為SEO從業者,不僅要被搜索引擎抓取,還要被收錄,最重要的是在收錄后有良好的排名,本文將簡單分析下搜索引擎收錄網頁的四個階段。每個網站、每個網頁的排名都是不一樣的,看看你的網站處于哪個階段呢?
 
網頁收錄第一階段:大小通吃
搜索引擎的網頁抓取都是采取「大小通吃」的策略,也就是把網頁中能發現的鏈接逐一加入到待抓取URL中,機械性的將新抓取的網頁中的URL提取出來,這種方式雖然比較古老,但效果很好,這就是為什么很多站長反應蜘蛛來訪問了,但沒有收錄的原因,這僅僅是第一階段。
網頁收錄第二階段:網頁評級
而第二階段則是對網頁的重要性進行評級,PageRank是一種著名的鏈接分析算法,可以用來衡量網頁的重要性,很自然的,站長可以用PageRank的思路來對URL進行排序,這就是各位熱衷的「發外鏈」,據一位朋友了解,在中國「發外鏈」這個市場每年有上億元的規模。    
爬蟲的目的就是去下載網頁,但PageRank是個全局性算法,也就是當所有網頁有下載完成后,其計算結果才是可靠的。對于中小網站來講,服務器如果質量不好,如果在抓取過程中,只看到部分內容,在抓取階段是無法獲得可靠的PageRank得分。
網頁收錄第三階段:OCIP策略
OPIC策略更像是PageRank算法的改進。在算法開始之前,每個網頁都給予相同的「現金」,每當下載某個頁面A后,A將自己的「現金」平均分給頁面中包含的鏈接頁面,把自己的「現金」清空。這就是為什么導出的鏈接越少,權重會越高的原因之一。
而對于待抓取的網頁,會根據手頭擁有的現金多少排序,優先下載現金最充裕的網頁,OCIP大致與PageRank思路一致,區別在于:PageRank每次要迭代計算,而OCIP則不需要,所以計算速度遠遠快于PageRank,適合實時計算使用。這可能就是為什么很多網頁會出現「秒收」的情況了。
網頁收錄第四階段:大站優先策略
大站優先的思路很直接,以網站為單位來衡量網頁的重要性,對于待抓取的URL隊列中的網頁,根據所述網站歸類,如果哪個網站等待下載的頁面最多,則優先下載這些鏈接。其本質思想是「傾向于優先下載大型網站URL」。因為大型網站往往包含更多的頁面。鑒于大型網站往往是名站,其網頁質量一般較高,所以這個思路雖然簡單,但有一定依據。
實驗表明這個算法雖然簡單粗暴,但卻能收錄高質量網頁,很有效果。這也是為什么許多網站的內容被轉載后,大站卻能排到你前面的最重要原因之一。
 
免責聲明:以上所展示的信息由網友自行發布,內容的真實性、準確性和合法性由發布者負責。 三龍匯之窗網對此不承擔任何保證責任, 三龍匯之窗網僅提供信息存儲空間服務。任何單位或個人如對以上內容有權利主張(包括但不限于侵犯著作權、商業信譽等),請與我們聯系并出示相關證據,我們將按國家相關法規即時移除。

本文地址:http://www.6977d.com/news/slh5365.html

 
更多>同類資訊
資訊圖文
今日熱榜
投資財經
營銷職場
商家產業
?
網站首頁  |  網站地圖  |  RSS訂閱  |  SiteMap
免責聲明:本站所有信息均來自互聯網搜集,產品相關信息的真實性準確性均由發布單位及個人負責,請大家仔細辨認!并不代表本站觀點,三龍匯之窗網對此不承擔任何相關法律責任!如有信息侵犯了您的權益,請告知,本站將立刻刪除。
友情提示:買產品需謹慎 網站處理與建議郵箱:slhzc@qq.com