主題門戶理論探究論文

時間:2022-11-04 03:35:00

導語:主題門戶理論探究論文一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

主題門戶理論探究論文

主題門戶是因特網信息資源發現的一種工具。然而到目前為止,主題門戶還沒有明確的定義。究其原因,可以從因特網的動態性得到答案:網絡上類似主題門戶的服務正快速增加;現有的主題門戶服務在范圍、內容、方法和特點上在不斷地變化。因此很難做到定義上的準而全。本文試圖在以往的研究基礎上對主題門戶的理論做一些探索。

1主題門戶的定義

許多早期的門戶起源于搜索引擎和有助于用戶獲取因特網內容的軟件程序。今天,搜索引擎仍是門戶的組成部分,而且已成為全部門戶策略的一部分。搜索引擎可以幫助用戶通過檢索獲得信息。為了減少搜索時間和幫助那些沒有經驗的用戶,一些搜索引擎加入了類目,通過預先設置的主題進行網址和文件的過濾,例如體育、氣象、旅游、財經、新聞、文化等。在結合了虛擬交流、實時聊天的功能,以及設置個性化搜索引擎界面、獲得專門和商業化內容的性能后,這個新概念被稱作門戶。目前,門戶可分為水平門戶和垂直門戶。水平門戶提供的信息服務雖然覆蓋面很廣,但大多是羅列傳統媒體信息,附帶介紹大眾關心的消息。用戶花費大量時間和金錢在水平門戶上希望獲得少而精的“所見即所得”信息,但用戶一一點擊瀏覽后,卻沒有發現符合其需求的信息。水平門戶最為典型的一個例子是Yahoo——來源極其廣泛,但內容卻很淺。隨著網民的多極化群體出現,人們尋求的信息更多地趨向專業化和個性化。網絡的發展客觀上需要一批能夠滿足特定領域人群、特定需求的專業化用戶,垂直門戶就是基于此目的而產生的。大學或圖書館更可能建設垂直門戶,集中于特定的用戶群,提供更專門的服務,這就是主題門戶,或稱學科信息門戶。

不同的機構、學者對主題門戶給出了不同的定義。

澳大利亞主題門戶論壇對主題門戶定義是:“基于網絡獲取高質量及評價過的資源的一套機制,用來支持特定主題的研究。”主題門戶是通過某個人口獲得的服務,通過開放的標準協議(例如,LDAP,Z39.50,HarvestBroker)來實現無縫鏈接。終端用戶看到的是基于網絡的簡單的界面,而實際上其組織的結構化程度比看到的更高[1]。

IMesh是英國的一個為期3年的研究項目,始于1999年,目標是支持主題門戶提供者和相關方的交流與合作,為促進主題門戶的發展提供一個交換想法和技術的開放論壇。IMeshToolkit項目給出了下面的定義:“主題門戶是圍繞特定主題對在線資源提供搜索和游覽入口的網站。主題門戶的資源描述通常是手工創建的,而不是通過自動的程序產生。因為資源的款目由手工產生,通常優于那些從傳統的網絡搜索引擎獲得的款目。”[2]

DESIRE是于1998年到2000年在歐洲執行的一個項目,包括4個國家10個參與者,解決主題門戶開發和利用的不同方面問題。它的主要的并且目前仍很實用的一個產品是建設門戶服務的詳細手冊。DESIRE項目提出主題門戶的定義是:“因特網上的選擇性主題門戶的特點是質量控制。資源選擇和描述的核心工作依賴于熟練的人工輸入(由圖書館員、學者和專家),不是自動化的?!盵3]

TraugottKoch認為:主題門戶是支持系統性資源發現的因特網服務。它們提供對那些主要可以通過因特網獲得的資源(文件、集合、網址或服務)的鏈接[4]。主題門戶的服務是基于資源描述的。通過主題結構來瀏覽資源是一個重要的特點。

IMeshToolkit項目的定義雖然強調了人工的資源描述,卻沒有明確資源是否經過篩選,其質量是否受到控制。DESIRE給出的定義忽略了對象資源,沒有明確主題門戶所提供的是何種資源。TraugottKoch給出的定義有幾點值得推敲:未說明主題門戶的質量控制特征,這就容易與一般的網絡服務,如因特網資源目錄混淆;沒有明確主題門戶的人工資源描述過程。澳大利亞學科信息門戶論壇定義雖然簡潔,卻隱含了人工資源描述的過程,相對來說比較完整準確。

TraugottKoch還進一步深化了主題門戶的定義,將它分為一般的主題門戶和質量控制主題門戶:描述較少、主題結構膚淺的鏈接列表,叫做主題門戶(比較上述);質量控制水平較高,描述和結構豐富的主題服務,叫做質量控制主題門戶[5]。

質量控制門戶是使用一整套質量控制機制來支持系統資源發現的因特網服務。使用相當多的人工來確保所選資源滿足質量標準,并利用標準元數據對這些資源進行詳細描述,進行定期的檢查和更新來確保較好的資源集合管理。主要的目標是通過使用可控詞對資源進行索引,以及對高級搜索和瀏覽提供深度的分類結構,來提供一個高質量的主題入口。Kirriemuir的調查研究中使用了兩個規則來選擇質量控制主題門戶:門戶的內容至少有一部分是英文的,門戶服務應提供相當數量的資源——至少是幾百個。

Wheatley認為,主題門戶在近期發展中,讓人失望的事情之一就是沒有廣泛使用可控詞匯提供資源的入口[6]。因此,TraugottKoch提出的質量控制主題門戶應該是目前門戶發展的方向。

了解主題門戶的定義,有助于人們辨析幾個相似的概念:

“基于主題(學科)的信息門戶”(SBIG),是由歐盟資助的DESIRE項目提出,基本上與主題門戶同義。

“資源發現系統”,其代表的概念比較廣泛,包括許多其他的發現工具,例如網絡索引、搜索服務、地方的數據庫或圖書館的OPACs。

“主題服務”,當一項服務將許多其他的不屬于門戶的特點和服務加到主題門戶上時,可以使用“主題服務”來代替主題門戶[7]。

“因特網資源目錄”(IRC),是通過結構化的網絡服務獲取的因特網資源描述的數據庫。它只是門戶提供的一項服務[8]。

那些純粹是當地的資源目錄或索引不能叫做門戶,包括或多或少因特網資源的圖書館目錄,盡管質量控制水平較高,但叫“主題門戶”也不恰當,因為它們主要列出的是當地的或物理的資源,而不是因特網上的分布式資源。

2主題門戶的特點

(1)信息資源選擇。主題門戶信息資源是由專家根據明確的甚至是嚴格的選擇標準精心挑選的。一般根據信息資源的質量、權威性、可獲得性、時效性和主題相關性來選擇,其他的標準也可能包括語言或地域范圍。例如:MedHist(medhist.ac.uk/)明確規定:信息資源在列入門戶之前必須先行評價,如果網站的目標對象不符合MedHist的目標對象要求,就不能收錄;如果對信息資源的準確性和適宜性有任何質疑也不能收錄;同時信息資源不能是過時的并可以定期維護,除非是惟一的并且特別重要的信息資源;能夠獲得、具有可用性。

(2)信息資源集合的維護。信息資源的集合需要定期維護,包括刪除那些不適當的信息資源、被取代的信息資源或含有錯誤款目的信息資源??赡芤残枰獙︽溄佣ㄆ跈z查。這些工作可以自動完成,也可以手工完成。例如,檢查鏈接可使用ROADSlinkchecker,Xenu,LinkBot,或者自己研發的工具。

(3)信息資源描述。選擇的信息資源由人工進行描述,采用一定的標準元數據編目。元數據使得信息資源的發現和定位變得容易,也可以促進結構化檢索。描述包括信息資源的內容、作者、出版者或出版日期等信息。例如,英國的資源發現網絡RDN使用了IAFA/ROADS文檔和SERVICE模版、都柏林核心集,瑞典的工程電子圖書館EELS使用了IAFA模版標準(來自ROADS系統),可轉換為都柏林核心集。

(4)主題分類。人工使用主題分類對所有的信息資源進行索引,可以促進主題瀏覽,例如RDN和EELS都是用了國際主體分類體系。

不同的主題門戶還有各自的一些特點,例如:

(1)SOSIS(社會科學信息門戶)提供了包含社會科學術語的主題詞表,并允許用戶對位于某一特定地理位置的資源進行搜索,例如世界范圍、歐洲或英國等[9]。EEVL(愛丁堡工程虛擬圖書館)允許用戶對某些資源類型進行搜索,例如電子期刊或會議資料等[10]。

(2)基于主題的服務。一些主題門戶提供了相關的服務。例如:Biz/ed(學生、教師和講師的商業經濟信息門戶)包括了大量的商業和經濟信息[11];OMNI,醫學與衛生主題門戶,允許用戶購買與健康相關的CD-ROMS[12]。

(3)個性化信息定制。中國科學院國家科學數字圖書館的學科信息門戶群的宗旨之一是逐步支持開放式集成定制。

3主題門戶的性質

在某種意義上,主題門戶相當于因特網上的學術或者專門圖書館,它具有如下性質。

(1)主題門戶是促進因特網信息資源發現的服務。主題門戶的信息資源不是對網上信息資源的簡單羅列。它以用戶為中心,由學科專家和信息專家評價并描述,有利于因特網信息資源的發現,具有信息增殖的特性。

(2)主題門戶是網絡信息資源的導航,是網上的三次信息,指向網上的一次信息(文件、超文本等)和二次信息(搜索引擎、指示數據庫等)。建立主題門戶的目的是為用戶提供便捷的導航,它具有嚴格的質量控制,針對目標群體,對入選信息資源進行描述甚至評述,幫助用戶快速、準確地發現高質量的信息。用戶只要來到相應的主題門戶,就可以在它的指導下找到需要的信息。

(3)主題門戶增加了網絡對用戶的“親和力”,增強網絡的實用性和服務性。主題門戶以新穎的、有特色的服務切入市場,可以吸引更多的、潛在的用戶群體。主題門戶專注于信息的專深性,更體現以人為本的理念,更吸引用戶的注意力。

(4)主題門戶是對信息構建理論的深化。信息構建的核心理念是關注用戶,以人為本。信息構建是信息用戶、信息內容與信息組織三者的交集。主題門戶網站的建設充分考慮了信息有效傳導的要求,立體地呈現出特定主題的各類信息資源(電子期刊、數據庫、知識庫、討論組等),符合特定用戶的需求,提高了資源獲取的效率。

雖然門戶是由搜索引擎發展而來,但主題門戶與搜索引擎在性質上并不相同(表1)。主題門戶對信息的揭示更專業更深入;而搜索引擎相對廣泛、膚淺。而且某些“隱藏網”內的信息(“隱藏網”指的是搜索引擎找不到的并且很少包括在主題目錄中的網頁),只有主題門戶能夠揭示。

對主題門戶來說,人工地選擇和創建記錄是必需的,與搜索引擎相比,主題門戶收錄的資源規模較小。人工語義加工的緩慢耗時和用戶需要更多門戶資源內容的矛盾是目前門戶的一個主要問題。研究人員正在尋求快速創建大規模門戶的方法。

表1主題門戶與搜索引擎的區別搜索引擎主題門戶

資源集由自動程序創建資源集由人工創建

資源集無目標用戶資源集以目標用戶為中心

目標是無遺漏地對資源進行索引目標是建立高質量的資源目錄

提供自動生成的元數據提供人工生成的元數據

終端用戶得到的結果質量較差終端用戶得到的結果質量較高

索引的對象是網頁,對資源的描述不連貫索引的對象是資源,對資源的描述連貫

收錄的資源規模較大收錄的資源規模較大

4主題門戶入口

主題門戶可以通過發現因特網信息資源的普通方法來確定,例如搜索引擎(Google);也可以通過電子討論列表和討論組提供的信息進入;或者通過個人的建議進入[13]。目前,許多圖書館和信息服務機構,不再只是列出其領域范圍的所有有用的因特網資源,而僅僅列出主題門戶。

下面介紹幾個主題門戶的列表:

(1)HeriotWatt大學的PINAKES(主題導航簿)門戶列表(www.hw.ac.uk/libWWW/irn/pinakes/pinakes.html)。PINAKES提供了吸引眼球的主題門戶列表,但對各個主題門戶的評價信息很少。

(2)Clearinghouse(),這是一個“通往門戶的門戶”。資源指南按照下列標準對各個門戶進行描述并對其質量進行“評分”:資源描述;資源評價;指南設計;組織方案和指南的元信息。

(3)中國科學院國家科學數字圖書館(),目前已經建成了6個主題門戶(物理、數學、化學、生命科學、資源和環境科學、圖書情報),是國內權威、可靠的主題門戶體系。

5結束語

主題門戶是圖書館和信息專業人員對資源發現問題的一個特別貢獻。但從目前情況看,主題門戶的利用范圍較小,還未被網絡用戶真正重視起來。通過主題門戶促進網絡資源的利用,既是事關我國互聯網信息服務發展的重大課題,也是未來信息工作者的一項重要任務。

【參考文獻】

1澳大利亞主題門戶論壇.www.nla.gov.au/initiatives/sg/servicetypes.html

2Imesh門戶.

3DESIRE項目網站.see

4,5,7TraugottKoch.Quality-controlledsubjectgateways:definitions,typologies,empiricaloverview,ManuscriptofthearticlepublishedintheSubjectgatewaysspecialissueof"OnlineInformationReview"Vol.24:1,Feb2000.Copyright:MCBUniv.Press

6Wheatley,A.(2000).SubjecttreesontheInternet:Anewroleforbibliographicalclassification.InA.R.Thomas,&J.R.Shearer(Eds.),Internetsearchingandindexing:Thesubjectapproach(pp.115-141).NewYork:HaworthPres

8英國的資源發現網.www.rdn.ac.uk/publications/terminology/

9SOSIG.社會科學信息門戶.www.sosing.ac.uk/

10EEVL.愛丁堡工程虛擬圖書館.EEVLallowsyoutosearchforresourcesofaparticulartypee.g.mailinglist.www.eevl.ac.uk/search,html

11Biz/ed.學生、教師和講師的商業經濟信息門戶.www.bized.ac.uk/

12OMNI.醫學網絡信息.omni.ac.uk/

13DavidBawden,LynRobinson.Internetsubjectgatewaysrevisited.InternationalJournalofInformationManagement,22(2002)