通用banner
您当前的位置 : 首 页 > 華企頭條 > 新聞中心

seo網頁質量間接測度指標

2017-02-17

網頁質量、網站權重在SEO眼裏是優化的基礎,一個缺乏基礎的網站,很難得到搜索引擎的重視。如何提升用戶以及搜索引擎對一個網站的評價,是重要的優化目標。相關系列文章:


1.網頁質量


2.結合網頁質量分析的搜索模式


3.網頁質量直接測度指標


1.基于網頁名譽度的評價指標


部分搜索引擎技术研究人员利用网页所在网站的名誉度(reputation)来评价网页质量。从概念上看,名誉度是指一种有助于别人判断是否可以投资或者保护的重要个人资产。在一定程度上,可以将其看成质量的期望(expectation 0f quality)。因为具有较高名誉度的客体通常有助于提升别人与其进行交流的可能。一个网站的名誉度类似于一个组织或者个人的名誉度。它需要相应主体真实的先期展示,并通过在提供诸如排名等服务的第三方组织评价中得以表达。即便是人们无法知道这个网站的名誉度,也会在看到网站的一瞬间,通过对其可视化内容的大致扫描,对其名誉度做出自己的判断,以决定离开还是继续浏览。也有的搜索引擎技术研究人员从多维分析的角度,给出了网页名誉度多维测度方法以间接测量网页的质量,这些多维指标包含可信度(trust)、权威性(authority)、内容相关性(aboutness)、再次访问的可能性(revisit)、可推荐程度(recommend)、可等级化(ranked)。網站建設,企業官網,建設網站


2.基于網站權威性的評價指標


有的搜索引擎技术研究人员声称网站的权威性(authority)在一定程度上直接影响着网站内容的质量,这种权威性来自于两个方面:一个是专业能力;另一个是可信度。除此以外,有很多评价网络信息的服务站点通常会强调网站内容的名誉度,具体指标包括相关度(relevance)、信息可靠性(reliability)、权威性(authority)、内容质量(quality of content)、可用性(usability)和客观性(objectivity)等。近年来,诸如全球信息基础设施裁定组织(Global Information Infrastruc.ture Award)等一些机构的排名服务也开始涉足網站質量的評價,包括對作者資質等情況的評價。


3.基于用戶相關度反饋信息的評價指標


搜索過程主要由用戶發出查詢開始,檢查返回的命中結果,並選擇其中的一部分內容做進一步的浏覽,這既可以通過當前檢索結果頁面上的鏈接來進行,也可以通過在打開的命中網頁中繼續點擊浏覽。這些在搜索時選中並浏覽的網頁序列構成了用戶檢索點擊流,它可以作爲測量用戶相關度反饋的信息源,被稱爲用戶相關度反饋信息。從定義上看,相關度反饋主要是指檢索用戶可以向檢索系統提供自己是否更喜歡某網頁的過程,從而間接反映查詢的相關度。它不僅可以改善當前用戶的搜索體驗,還可以提高所有檢索用戶的搜索質量。例如,可以提升被訪問次數多的網頁權重等,而且也可以作爲相關網頁質量的評價指標。


信息檢索系統收集用戶相關度反饋信息的方式主要有兩種:一種是顯式的方法,它要求用戶在檢索時主動地對和查詢相關的文檔做標記,這種方式雖然效果明顯,但是會增加用戶使用負擔,一般的用戶很難願意配合這種信息收集行爲;另一種是隱式的方法,它一般無需用戶主動提交,通過探測用戶行爲,並以此來間接評價結果文檔的相關度。它建立在一個假設基礎之上,那就是用戶在檢索時會持續地進行隱式的結果相關性判斷。從理論上看,利用隱式方法得到的信息並不十分准確,從被觀察的檢索活動到相關度的判斷過程都有可能存在潛在的誤差,這顯然會導致將更多的不相關文檔標記爲相關文檔。但是,隱式方式也具有顯式方法不可比擬的優點,如不增大用戶使用負擔。事實上,由于需要用戶主動提交,顯式方法所收集的信息相當有限。相比之下,利用隱式方法收集而來的信息更多,也更爲詳細,而且即便是存在誤差,只要收集到足夠多的數據樣本,通過一些數據分析方法就可以很好地去除那些噪聲數據。


研究者已經提出了很多可以用于隱式收集相關度反饋信息的途徑,如在搜索結果文檔列表中點擊選擇某些文檔的行爲、在網頁文本中的翻滾行爲對網頁做書簽的行爲、打印網頁的行爲和浏覽網頁所花費的時間。其中,有些指標也存在一定的爭議。例如,有的搜索引擎技術研究人員就認爲,浏覽每個網頁所花費的時間並不能有效代表用戶對這個網頁相關度的認可程度;甚至有些搜索引擎技術研究人員認爲,浏覽網頁所花費的時間根本就是一個不可靠的相關度反饋測量指標,主要原因在于存在一些和相關度沒有關系的因素于擾,如任務本身、文檔集合特點和檢索環境等都會影響浏覽時間。



其他搜索引擎技術研究人員也提出了綜合的方法來改善隱式方法的分析效果如同時考慮浏覽時間、是否打印網頁和保存網頁、翻滾網頁和保存書簽等用戶行爲將能取得更好的效果。還有搜索引擎技術研究人員認爲,在非試驗環境下,將用戶在查詢時發出的點擊數與用戶和檢索系統交互的全部時間結合起來,可以有效地揣度用戶對網頁文檔的滿意度。但是,從總體來看,相關試驗的效果並不是十分理想,即便是可行,但是相關數據的收集工作卻較難展開,甚至無法得到較爲豐富的數據。因此,點擊流數據就稱爲一種較好的隱式分析數據源,它在非試驗環境下易于收集,而且比其他幾種用于隱式收集相關度反饋信息的數據更爲准確。它建立在一個假設之上,那就是被點擊的文檔應該比沒有被點擊的文檔更爲相關很多搜索引擎技術研究人員在這方面做了研究,如使用點擊數據來訓練檢索算法,按照用戶點擊數量來對檢索結果重排序,也有搜索引擎技術研究人員從被點擊文檔中提取候選詞語來對查詢進行擴展以提高檢索精度。



從理論上看,利用點擊流進行分析是一種協同過濾技術。當利用相關度反饋信息服務所有檢索用戶時,原先檢索用戶認爲的相關文檔就會被認爲與其他用戶相關。如果這些用戶具有相同的查詢需求,則這種相關度反饋就會提高檢索效果。但是點擊流分析技術和一般的協同過濾技術也存在不同,主要在于一般的協同過濾技術主要是面向那些具有相對穩定興趣的用戶群體,所以便于基于他們先前的興趣來預測可能的興趣,而作爲信息檢索用戶,他們每一次鍵入的查詢都可能具有完全不一樣的語義。



在這方面的很多先前研究工作都往往集中于對搜索結果網頁中文檔的點擊情況進行分析,而缺乏對每個用戶整個搜索過程所涉及的全部文檔進行分析。有搜索引擎技術研究人員通過人工評價試驗發現,在搜索過程中産生的所有相關度反饋信息都可以有效地提高進一步查詢的精度和可信度,所以從用戶搜索過程中的全部網頁信息中提煉點擊流數據將是有效提高相關度反饋精准度的方法.


標簽

本文網址:/news/643.html
下一篇:SEO項目的管理控制2017-02-20

最近浏覽: