網絡分類法構建研究論文
時間:2022-03-12 08:59:00
導語:網絡分類法構建研究論文一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。
【內容提要】文章從建構方法、原則、語言、大綱、現代技術應用、具體問題等方面,概括了近年來網絡信息分類法構建的研究進展。
【摘要題】信息資源建設與管理
【關鍵詞】網絡信息分類法/網絡信息組織/分類法構建
【正文】
根據網絡信息和用戶檢索需求的特點,依據網絡環境構建科學、實用的網絡信息分類法,是信息資源組織管理研究的重點之一。本文主要以1999年—2005年的中國學術期刊網數據為信息源,從構建方法、原則、語言、大綱、信息技術應用等6個方面回顧了近年來網絡信息分類法構建的研究進展。
1構建網絡信息分類法的依據或方法
目前,網絡信息分類法主要是指網絡搜索引擎分類體系。基于“分類工具通常是根據分類對象的特點和用戶需求,結合一定的技術環境建立的”認識,馬張華在《分類搜索引擎類目體系研究》一文中論述了分類搜索引擎類目結構的編制依據:(1)從分類對象來看,網絡資源的特點是數量、種類多,動態性強,新興科學、商業、娛樂的資源數量較多,傳統知識門類的資源相對較少,要求有新的、適合處理對象的分類架構。(2)從用戶需求來看,網絡的使用對象涉及所有的終端用戶。(3)從技術環境來看,網絡信息分類體系應充分利用計算機操作環境與超文本技術,在體系構建、類目設置等方面發展不同于傳統分類法的技術特色。[1]
陳樹年提出建構網上知識分類體系的(基本結構)編制方法,即:①有一個涵蓋各知識領域、結構清晰、層次簡明、能滿足網上信息組織需要的分類體系;②采用等級結構展示知識的系統聯系,構成枝干分明的主題樹或脈絡清晰的知識地圖;③類目的排列和檢索結果的排列方法應采用對用戶最有用的排列次序;④分類體系的標記應適當保留。[2]石曉華等在分析了網絡信息分類法與傳統分類法的優劣之后,首次提出了建構《中國網絡信息分類法》的建議,并列舉了具體的編制方法,即:①以傳統分類主題體系為基礎,建構多維的分類體系;②欄目因需而設,突出重點;③控制分級,減少欄目層次;④根據用戶確定欄目名稱的規范程度。[3]張琪玉則提出了一整套設計方針,即:①為不同類型的需求提供不同特性的分類體系;②在統一框架下設置分散獨立、各自完整的分類體系;③分類體系的類目設置不以網羅全部網絡信息資源為目標;④分類體系應具有開放性和可變性,并應有反映新穎信息的措施。他也設計了一個供普通用戶使用的分類體系框架。[4]王知津贊同石曉華的第①、②、③建議,認為可以借鑒傳統分類體系,構建《網絡信息分類法》,實現網絡信息分類法與主題詞表的結合,即分類主題一體化。實現分類主題一體化,需要做好三個方面的工作:①建立一個結構簡明的知識分類體系,通過對信息資源的系統分類,實現對網絡信息的宏觀控制;②建立一個智能化的控制詞表,實現作者語言與用戶檢索語言的控制和轉換;③建立分類體系與控制詞表的系統聯系,即將標引語言納入分類體系,這樣既可以用自然語言直接檢索,也可以在任何類下進行語詞檢索,從而較好實現分類與主題的兼容。[5]董琳提出的思路是設計一個融知識分類、行業分類、網站信息分類于一體的綜合性中文網站分類體系。[6]該體系把一級大類分為5大模塊:較豐富信息的模塊、高查詢率模塊、學科專業模塊、查詢入口模塊、綜合網站模塊。常設20個一級類目,把主題作為主要聚類標準,學科和專業作為輔助聚類標準。
另外,陸寶益提出編制的具體步驟,即建立專門機構,配備專業人員;開展深入調研,制定可行計劃;廣泛征求意見,不斷修改完善。[7]其他學者,如陳代春、趙培云、劉穎、許磊等也從不同角度論述了如何構建統一的網絡信息分類法的問題。
2網絡信息分類法構建的原則
構建新的網絡信息分類體系,需要吸收現有搜索引擎分類體系優勢,借鑒傳統分類法的部分長處,并遵循基本的設計指導原則。有的學者[8]認為,強調類表的科學性和專業性,而忽略了最終用戶——信息需求者的利益,是傳統文獻分類法無法適應網絡信息分類的基本原因之一,所以建立中文網絡信息分類體系應以實用性為主。持相同觀點的學者,如,史學斌提出“實用性、自然性、系統性和技術性、針對性”原則[9]。鄭慶勝指出“實用性、全面性、規律性、統一性和特殊性”原則[10]等。
持相反觀點的學者認為,首要的原則是科學性原則。吳丹認為,與傳統分類法一樣,網絡信息分類也必須具備科學性原則,分類體系仍必須以科學的知識分類為基礎,即科學性原則、易用性原則、針對性原則、動態性原則[11]。其他學者,如陸寶益提出“科學性、自然性、實用性、同一性、通用性、兼容性、發展性”原則[12]、朱蓓玲提出“科學性、實用性、易用性、自然性、針對性、快捷性、系統技術性”原則[13]。敬卿、吳靜提出的“科學性、實用性、易用性、自然性、通用性”原則[14]。鄧香蓮提出的“科學性、簡潔性、直接性、實用性、動態性、自然性”原則[15]也應歸屬此類。
關于網絡信息分類體系的原則,研究者智者見智,較多學者都提到了應遵循“科學性、實用性、自然性”原則。主要分歧是強調科學性優先還是實用性優先。筆者認為,網絡信息分類法要適應組織網絡信息動態變化的需要,滿足用戶復雜的信息查詢需求,對于綜合性、大眾性的中文網絡信息分類體系,必須以實用性原則為主,兼顧科學性的原則。
3網絡信息分類法構建的語言
從實踐來看,傳統的文獻分類法使用的是典型的人工語言,而網絡信息分類法使用的主要是自然語言。因為人工語言嚴格的規范性使用戶喪失了檢索中的自主性和能動性,背離了以人為本的原則,自然語言是檢索語言發展的必然。[16]張琪玉教授則指出由于自然語言有其固有的缺陷,網絡信息檢索不可能僅僅使用自然語言,也必須使用人工語言。情報檢索用語發展的大趨勢,是情報檢索語言的自然語言化和自然語言的情報檢索語言化,是兩者的初級結合到完全融合的過程。[17]所以有的學者認為需要對網絡受控語言進行適合于網民大眾習慣用語的改造,提出了“受控語言網民化”的思想。[18]陳晶也指出:“改進受控語言的易用化是網絡環境下的大勢所趨,而對自然語言進行必要的控制也是網絡環境下勢在必行的,兩者的相互滲透、有機結合是情報檢索語言發展的大趨勢。”[19]
有的學者認為分類主題一體化語言,實質是受控語言內部的一體化,它不能適應網絡檢索的發展,應當建立更適合于網絡信息檢索的自然語言與受控語言結合的一體化語言。[20]有的學者通過分析受控語言和自然語言各自在網絡中的應用,分析其優缺點,指出無論受控語言還是自然語言都有各自獨特的優點和缺陷,不能彼此取代,可以相互補充。而“它們在網絡中的應用研究也表明兩者之間呈現出明顯的相互交織兼容的趨勢”。[21]
筆者認為,任何一種語言都有長處和短處,都不能完全滿足網絡用戶多樣化需求,分類語言和主題語言相結合、自然語言和人工語言相結合才是建構網絡信息分類法的發展趨勢。
4網絡信息分類法的大綱設計
對網絡信息分類法進行深入研究并提出大綱或框架的代表作有文獻[22]、[23]、[24]。陳樹年闡述了構建網上分類體系的原則與技術后,提出了一個適用于一般用戶的綜合性中文搜索引擎的信息分類大綱,該大綱包括22個大類,即哲學與宗教、人文與社會科學、社會文化、文學與藝術、教育與人才、體育與健身、休閑與生活娛樂、旅游與服務業、醫學與健康、經濟與金融、政治、法律、軍事、歷史與地理、自然科學、農業科學、工程技術、計算機與網絡、新聞與媒體、圖書館與參考資料、國家與地區、綜合網站。并指出以學術和技術為主的搜索引擎、專業搜索引擎最好以權威分類法(或其中的某些類)為基礎,經過一定的改造后用于網上信息的組織和檢索,因為其科學的體系和嚴密的結構是非專業人員所不能獨立完成的。[22]吳丹采取學科分類與事物分類兼顧的方式,也設計了一個包含有18個大類和若干二級類目的網絡信息分類體系設計方案。18個大類,即政治法律與軍事、新聞與媒體、商業與經濟、自然科學、農業與工程技術、計算機與網絡、教育、哲學與宗教、人文社會科學、文化藝術、歷史與地理、國家與地區、旅游與交通、醫學與健康、生活服務、體育與健身、娛樂休閑、圖書館與參考資料。[23]許培揚提出了中文網絡信息分類法應由簡表、主表、索引和使用指南四部分組成。簡表一般由1-4級類目構成,主表由全部類目構成。索引包括:①本表與其他分類體系的對應,用于不同分類體系的轉換;②英譯名稱索引,從英查漢或從漢查英。使用指南是分類體系的詳細說明。[24]
5現代技術在網絡信息分類法構建中的應用
由于網絡信息分類法必須能適應網絡技術環境,這就要求在編制過程中適當采用許多現代信息技術,如自動分類技術、人工智能技術、網格技術等等,以適應網絡技術環境的發展特點。馬張華專文闡述了超文本技術在網絡信息分類法編制中的應用。[25]他指出:超文本技術可以改進主題之間多維關系的揭示;可以從多個角度組織信息資源;可以進行輪排,亦即多表列類;可以設置鏡像類目,根據需要對某些重點類目或熱點類目突出反映;可以動態設置類目和動態揭示類目之間的關系,根據需要及時增添類目或刪改類目;可用于聯結不同的檢索系統,增加檢索入口;可以聯結分類體系與相應的說明文字與規則系統。
陳旭論述了分面分類在網絡信息分類法編制中的應用。[26]文章首先論述了在編制網絡信息分類法時,可根據需要利用仿分技術編制各種類型的通用復分表、專用復分表及規定必要的仿分。其次論述了分面敘詞表的應用。最后論述了分面分類在可視化檢索中的應用。即在檢索界面上設置主題分面、書目形式分面、時間分面和地域分面,然后再按等級列舉的方式分別展開,既便于類表的修訂與維護,又便于用戶檢索更為專指的信息。
周淑云在《分類主題一體化構建網絡信息分類體系》[27]一文中指出,理想的網絡分類法應是分類法和主題法的結合使用,理想的模式是以“分類一主題”的方式對知識進行組織,形成一種兼具分類、主題兩種標引和查找功能的新型檢索語言,從而為不同層次和不同需求的用戶分別提供不同的信息查詢功能。分類主題一體化的網絡分類體系既突破了傳統分類法層層劃分、層層隸屬的等級結構又克服了主題法系統性差,將同類信息分類的特點。對此問題進行論述的還有郭麗芳、梅伯平、蘇瑞竹等。
6構建中微觀層面的具體問題
對網絡信息分類法編制的一些具體問題,許多學者都予以了詳細的探討。
陳樹年在《網絡信息分類法研究》中研究了聚類標準、大類設置、展開層次、類目種類、類目名稱、多分類體系、分類標準與使用次序、類目設置的均衡性和規律性、重點類目、交叉關系的處理、類目的排列、類目的注釋和說明、用戶界面的設計等,并給出了相應的改進意見。[28]他認為,關于聚類標準,綜合性網絡信息分類法聚類的主要標準應當是“主題和專題”,專業搜索引擎可以學科或專業為主要聚類標準,或結合主題聚類運用;關于大類的設置數量通常以10-20個為宜;關于類目的名稱要做到準確、通用和精練;關于類目種類包括“子類”與“網站”兩種,“在每一類下,把內容寬泛,各個下位類不能容納的信息歸納為‘綜合網站’集中收錄是網絡分婁法實用的作法”。
其它方面,人們觀點大致雷同。如,關于分類體系展開層次,陳樹年提出基本應控制在3-6級之間;趙培云認為根據目前網絡信息的實際情況和用戶瀏覽查詢心理,綜合性網絡信息分類標準,類目應控制在三、四層為宜,專業搜索引擎和網站可適當延伸。[29]張琪玉提出類目細分應控制在五級左右。[30]
總之,由于網絡信息、網絡信息用戶、網絡信息技術環境等特點,這就決定了網絡信息分類法的編制原則和技術方法,有別于傳統分類法的編制原則和技術方法,但是傳統文獻分類法和現有網絡信息分類體系的成功經驗可以給網絡信息分類法提供有益的借鑒。我們建議,應當由國家信息產業部牽頭,組織圖書情報界專家、計算機專家、網絡公司等相關專家,廣泛征求意見,盡早編制出一部用戶滿意、質量較高的網絡信息分類法。
【參考文獻】
[1]馬張華.分類搜索引擎類目體系研究.圖書情報工作,2001(2):36-40
[2][22]陳樹年.搜索引擎及網絡信息資源的分類組織.圖書情報工作,2000(4):31-37
[3]石曉華,王春芳。網絡信息分類與傳統分類法的優劣分析——兼談構建《中國網絡信息分類法》.圖書館理論與實踐,2001(1):43-45
[4][30]張琪玉.網絡信息檢索工具的分類體系.江蘇圖書館學報,2002(4):7-11
[5]王知津,肖洪.網絡信息組織對傳統信息組織的借鑒.圖書館工作與研究,2003(4):2-7
[6]董琳.網絡信息分類組織的發展趨勢與標準化.圖書情報知識,2004(2):65-67
[7][12]陸寶益.論創建我國統一的網絡信息分類法.中國圖書館學報,2004(6):44-47
[8]千忠紅.網絡信息環境下的傳統分類法.圖書情報工作,1999(2):37-39
[9]史學斌.網絡信息分類體系.圖書館,2002(1):33-35,20
[10]鄭慶勝,易曉陽.從新浪等網站看網絡信息分類體系的建立.圖書館建設,2003(1):69-71
[11][23]吳丹.網絡信息分類體系設計.圖書情報知識,2002(5):37-39
[13]朱蓓玲.淺析構建網絡信息分類體系.情報雜志,2004(8):110-111,114
[14]敬卿,吳靜.網絡分類目錄規范化初探.圖書館,2002(1):49-50
[15]鄧香蓮.文獻信息分類與網絡信息分類之比較研究.情報資料工作,2002(6):43-45
[16]粟慧.以人為本的必然:人工檢索語言向自然語言的轉變.圖書館,2000(2):9-10
[17]張琪玉.網絡信息檢索用語言的發展趨勢.圖書館雜志,2001(3):5-7
[18]梁樹柏,高夕果.受控語言網民化的思考.情報雜志,2002(8):69-71
[19]陳晶.論網絡環境下情報檢索語言的發展.情報雜志,2002(6):54-55
[20]呂娟,袁相琴.論第四種情報檢索語言系統.中國圖書館學報,2002(1):87-92
[21]焦玉英,李法運.網絡環境下信息檢索語言的優化研究.情報學報,2003(3):291-296
[24]許培揚,張玢.網絡信息分類標準研究進展.醫學情報工作,2002(6):324-326
[25]馬張華,李玲.超文本技術在分類法編制中的應用.大學圖書館學報,2001(1):60-62,66
[26]陳旭.分面分類在網絡資源組織中的應用.圖書情報工作,2002(1):59-61
[27]周淑云.分類主題一體化構建網絡信息分類體系.現代情報,2003(4):113-114
[28]陳樹年.網絡信息分類法研究.現代圖書情報技術,2002(3):54-57
[29]趙培云.如何構建統一的網絡信息分類標準.河南圖書館學刊,2004,24(2):64-65
- 上一篇:局域網ARP分析論文
- 下一篇:局域網作業管理論文