成人年无码av片在线观看_中文字幕一区二区三区人妻少妇_国产精品一区二区 尿失禁_久久99久久99精品免观看_色综合久久一区二区三区

CASES 案例 我們的作品,他們的故事
Our work, their stories
百度重點(diǎn)頁面判斷
網(wǎng)頁權(quán)威性是搜索引擎對(duì)結(jié)果進(jìn)行排序的一個(gè)重要參考因素。
  計(jì)算網(wǎng)頁權(quán)威性時(shí),將參與計(jì)算的所有網(wǎng)頁作為一個(gè)集合,并通過集合內(nèi)網(wǎng)頁之間的鏈接關(guān)系迭代計(jì)算網(wǎng)頁的權(quán)威性。
  但是隨著互聯(lián)網(wǎng)的發(fā)展,互聯(lián)網(wǎng)上的網(wǎng)頁越來越多,如果將互聯(lián)網(wǎng)上所有網(wǎng)頁都作為參與權(quán)威性計(jì)算的網(wǎng)頁,則對(duì)計(jì)算系統(tǒng)的架構(gòu)要求非常高,因此通常僅挑選各網(wǎng)站與外部網(wǎng)站存在鏈接關(guān)系的網(wǎng)頁作為參與權(quán)威性計(jì)算的網(wǎng)頁,但是現(xiàn)有技術(shù)的這種方式,會(huì)導(dǎo)致各網(wǎng)站內(nèi)部的一些優(yōu)秀網(wǎng)頁無法得到權(quán)威性值,此外,也會(huì)影響參與計(jì)算的網(wǎng)頁得到的權(quán)威性值的準(zhǔn)確性。
 
為了改善上述問題,現(xiàn)有技術(shù)有一種做法,是將網(wǎng)站內(nèi)與外部網(wǎng)站存在鏈接關(guān)系的網(wǎng)頁,以及網(wǎng)站內(nèi)的一些重要網(wǎng)頁一起提取出來,作為參與網(wǎng)頁權(quán)威性計(jì)算的網(wǎng)頁。
  在現(xiàn)有技術(shù)中,是通過網(wǎng)站中網(wǎng)頁的站內(nèi)反鏈數(shù)量來確定網(wǎng)頁的重要性的,例如將網(wǎng)站中站內(nèi)反鏈數(shù)量大于設(shè)定閾值的網(wǎng)頁提取出來,如果這些網(wǎng)頁所指向網(wǎng)頁的站內(nèi)反鏈數(shù)量也大于設(shè)定閾值,則將這些網(wǎng)頁及所指網(wǎng)頁作為重點(diǎn)網(wǎng)頁。但是這種現(xiàn)有技術(shù)的方法,召回率較低,準(zhǔn)確性也較差。
 。▉碓从诎俣人惴▽@麅(nèi)容)
  新算法權(quán)威度調(diào)整
  1.網(wǎng)頁中的所有鏈接提取出來
  2.對(duì)網(wǎng)站所有鏈接進(jìn)行拆分重組排列(源代碼里最近的鏈接組成)3.從各個(gè)鏈接(內(nèi)鏈)中進(jìn)行匹配出現(xiàn)值最高的鏈接 例:多次A鏈接B,或不同ABC鏈接D4.有一個(gè)預(yù)定的閥值,如果不超過閥值那么將歸類于普通頁面,如沒有任何重點(diǎn)頁面(入口頁)則僅留下首頁為重點(diǎn)頁面.
  5.重點(diǎn)鏈接是有數(shù)量上限,取決于鏈接對(duì)最多的頁面權(quán)威性,頁面權(quán)威性越高,重點(diǎn)頁面的數(shù)量就越高,比例通常在10-30%浮動(dòng),也就是一萬個(gè)頁面,可以出現(xiàn)1000-3000的參與排名的頁面。
  6.百度訓(xùn)練模型將對(duì)鏈接對(duì)進(jìn)行一次匹配分類,區(qū)分重要程度。
  7.百度訓(xùn)練模型的對(duì)鏈接進(jìn)行重要鏈接比對(duì)和非重要鏈接比對(duì)8.對(duì)重要鏈接進(jìn)行分類特征對(duì)比,以確定重要鏈接的參數(shù)范圍和特征范圍。
  9.百度會(huì)對(duì)鏈接先進(jìn)行參數(shù)范圍和特征范圍匹配,然后在進(jìn)行重要程序分級(jí)。
  10.內(nèi)鏈和反鏈的出面度是根據(jù)數(shù)量來決定,如果一個(gè)頁面有3個(gè)內(nèi)鏈,那么他的出面度就是311.對(duì)重要頁面的深度進(jìn)行說明,從首頁跳轉(zhuǎn)到對(duì)應(yīng)頁面的最短次數(shù),這個(gè)次數(shù)被定義為深度,重要頁面的深度會(huì)一定程度的影響頁面屬性。
  12.內(nèi)鏈指向重要頁面的錨文本總數(shù),是根據(jù)切詞組成,也就是例如抽動(dòng)癥治療頁面指向給了抽動(dòng)癥,那么抽動(dòng)癥這個(gè)頁面的錨文本總數(shù)就是3個(gè),抽動(dòng)癥治療,抽動(dòng)癥,治療。3個(gè)錨文本。
  13.根據(jù)重點(diǎn)頁面相互連接生成網(wǎng)站骨架,以定義網(wǎng)站的類型總結(jié):頁面的權(quán)威度由頁面的深度,被指向內(nèi)鏈的深度對(duì)比,錨文本詞頻、頁面出度、兩個(gè)頁面深度之間的差值來綜合評(píng)比頁面權(quán)威度。
 
       總結(jié):頁面的權(quán)威度由頁面的深度,被指向內(nèi)鏈的深度對(duì)比,錨文本詞頻、頁面出度、兩個(gè)頁面深度之間的差值來綜合評(píng)比頁面權(quán)威度。
最新資訊
在線咨詢