電子文件管理元數據研究論文

時間:2022-09-13 05:35:00

導語:電子文件管理元數據研究論文一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

電子文件管理元數據研究論文

本文通過對電子文件管理元數據單一線型化宏觀結構和多維分面化宏觀架構理論及分面架構本質的研究,從而看出分面化宏觀架構具有特有的優勢,進而得出分面方法對指導電子文件管理元數據標準化方面具有深刻意義,值得我們研究。

電子文件管理元數據宏觀結構分面化的基本概念

電子文件管理元數據結構分為宏觀結構和微觀結構,所謂宏觀結構就是電子文件管理元數據頂層框架的架構,而微觀結構是指電子文件管理元數據元素的構成。本文主要研究的是電子文件管理元數據宏觀結構的分面化問題。

所謂“分面”,是指可以表征一類事物某一方面屬性的一組簡單概念元素。對于同一類事物,可以用多種屬性作為劃分標準,形成多個面——分解[1]。在所形成的多個分面之間,是相互獨立并行的,因此各分面內的元素就可以進行組合——組配。這種組配由于有“多個面”參與,所以可以多維地、全面地揭示事物的屬性;由于參與的“多個面”是組配的,所以又可以靈活地、方便地揭示事物的屬性。

而所謂的“分面化”,則是指從系統角度出發,運用分解和組配的方法建立電子文件管理元數據宏觀結構的架構過程。分面化往往是相對于單一線型化而言的。由于在電子文件管理元數據的宏觀結構的架構上存在著多維分面化架構與單一線型化的架構,而且,在時間上,單一線型化的架構產生于多維分面化的架構之前,所以,研究電子文件管理元數據宏觀結構的多維分面化,首先應該研究電子文件管理元數據單一線型化的架構。

電子文件管理元數據單一線型化架構的分析

所謂的電子文件管理元數據單一線型化架構,就是指在架構電子文件管理元數據的宏觀結構時,將電子文件作為一個固定的實體,然后,按照文件管理流程一維地將電子文件劃分為不同的類型的元數據,然后再依次對所劃分出的不同類型元數據再進行細分,由此所形成的單一線型的結構。這種單一線型化的架構方式,典型的是以澳大利亞維多利亞州《電子文件管理元數據標準》為代表,該標準首先是將電子文件依據文件管理流程劃分成幾個不同類型的元數據,即劃分為“文稿、文件、文件組合、文件集”等類型的元數據,然后在這基礎上,再進一步對“文稿、文件、文件組合”進行細分,從而在“文稿”下再列出文稿的特征元數據、在“文件”下再列出文件的特征元數據、在“文件組合”下再列出文件組合的特征元數據及在“文件集”下再列出文件集的特征元數據,由此便形成了單一逐級劃分的線型框架架構。

具體來看,該標準對“文稿”細分出了“責任者”、“描述”、“語種”、“題名”、“主題”、“來源”、“功能”、“日期”、“關系”、“權限管理”、“內容范圍”十一個特征元數據,這些特征元數據,都是描述“文稿”所應有的;對“文件”的細分,也是分出了與“文稿”相同的十一個特征元數據,這是因為文件與文稿都是具有相同性質的電子文件,所以,描述它們特征的元數據也就必然是相同的,同樣,“文件組合”、“文件集”也是與“文稿”、“文件”具有相同性質的電子文件,其差別僅僅是文稿、文件、文件組合和文件集是電子文件表現的不同形式和級次而已。所以,在對“文件組合”、“文件集”的細分,其細分出來的特征元數據也與文稿和文件的相同。

由此可看出這種單一線型化宏觀結構中隱含著大量的相同的元數據元素,即元數據元素的冗余度很大,這種冗余度而且會隨著對元數據不斷細分,會呈幾倍或幾十倍的倍率增加,其結果相同元數據元素的數量極其龐大。

再對電子文件的文稿中的“責任者”進行細分,又分出10個描述文稿“責任者”的特征元數據元素,分別為“責任者類型”、“個人ID號”、“個人姓名”、“部門名稱”、“職務名稱”、“聯系方式”、“電子郵箱”、“數字化簽名”、“機構標識符”、“機構名稱”,同樣對文件、文件組合、文件集中“責任者”進行細分,分出來的特征元數據元素與文稿中的“責任者”下的特征元數據元素也完全相同。由此可見,電子文件管理元數據單一線型化的宏觀架構會導致元數據嚴重冗余,數量龐大,十分不科學。

為了降低冗余度,澳大利亞維多利亞州《電子文件管理元數據標準》采用了減少對元數據元素細分的方式來減少相同的元數據元素,其具體做法是對“文稿”下特征元數據元素都沒有進一步細分,僅有如“責任者”、“題名”、“權限管理”、“主題”等特征元數據,而對“文件”、“文件組合”和“文件集”下的特征元數據都進行了進一步的細分。采用這種方式,可以減少“文稿”下特征元數據元素的冗余。但也有其局限性,就是降低了元數據元素的專指度,仍以“文稿”的“責任者”為例,如不對其進行細分,那么這個“責任者”元素就很不專指,就很難確切地表達責任者的類型,是機構團體責任者還是個人責任者,以及責任者的部門名稱、職務、聯系方式、數字簽名等具體含義。

由此可見,單一線型化宏觀架構局限性是:

(1)因其對電子文件是按照單一線型的逐級劃分方式進行的,使得元數據冗余呈倍數上升,冗余度十分大;

(2)為降低冗余度,減少細分級次,又降低了電子文件管理元數據元素的專指度,表達語義不具體;

(3)因其是一維展開的,難以多維、靈活地揭示電子文件的特征。

正因電子文件管理元數據單一線型化架構存在以上的缺點,才促使人們努力完善電子文件管理元數據宏觀架構,因而才有分面架構的出現。

電子文件管理元數據多維分面化架構的分析

所謂的電子文件管理元數據多維分面化架構,就是指在架構電子文件管理元數據的宏觀結構時,利用分面的方法,將電子文件劃分成多個分面,各個分面內的元數據元素可互相進行組配,從而形成滿足各種需求的電子文件管理元數據,電子文件管理元數據的多維分面化架構典型的是以《澳大利亞文件管理元數據方案》[2]標準為代表,該標準采用分面的方法,將電子文件實體分為“文件”面、“責任者”面、“業務處置”等面,其中,每一個分面之下,再細分成亞面——類型面和依附于類型面的亞面—特征描述面,這樣面和面之間可以組配,亞面和亞面之間也可以組配,便形成電子文件管理元數據多維分面化架構。如以這樣的結構同樣表示“文稿”、“文件”、“文件組合”和“文件集”的責任者特征,就可以將文件分面與責任者分面進行組配來表達,見圖1所示。

圖1電子文件管理元數據的文件分面與責任者分面的組配

從圖1可以看出,文件分面下的“文稿、文件、文件組合、文件集”它們分別可與責任者分面進行組配,從而可以形成多種責任者類型——如文稿責任者類型(內部責任者和外部責任者)、文件責任者類型(內部責任者和外部責任者)、文件組合責任者類型(內部責任者和外部責任者)、文件集責任者類型(內部責任者和外部責任者),也就是說采用多維分面化架構可以達到同樣的單一線型架構細分的效果,但是其結構卻更簡潔明了,元數據元素的冗余度也大大減少。由于多維分面化結構是可以多維組配的,因此,除了分面與分面之間的組配外,還可以在各分面內進行亞面與亞面的組配,也就是各分面下的子分面與子分面進行組配,如圖2所示。

從圖2可以看出,當責任者的“內部責任者”亞面與責任者的“特征”亞面組配時,就可以形成“人員責任者的ID,人員責任者名稱、人員責任者時間、人員責任者授權、人員責任者聯系方式、人員責任者關系、人員責任者概況”等一系列表示人員責任者的元數據元素,同樣,將單位責任者、機構責任者、組織責任者分別與責任者的特征亞面組配,也可以形成單位責任者、機構責任者和組織責任者一系列表示責任者特征的元數據元素,其達到的效果也如前電子文件管理元數據單一線型架構細分所列舉出的責任者特征效果一樣,同樣,采用這種多維分面化架構,不僅元數據元素的冗余度大大減少,而且也使元數據的宏觀結構的安排更合理。

圖2電子文件管理元數據的責任者亞面之間的組配

電子文件管理元數據多維分面化架構的本質

從上面對電子文件管理元數據多維分面化架構的分析,似乎“組配”是多維分面化架構的本質,其實“組配”僅僅是其的表面現象,而其本質卻是對電子文件管理元數據系統的分解。

從系統論的角度看,電子文件管理元數據也是一個系統,而多維分面化則正是通過對該系統科學分解而架構起來的,即通過對電子文件管理元數據綜合分析,通過分解,建立起多維分面,而分面組配僅僅是對電子文件管理元數據系統的分解在結構上所進行的還原。由此可見,“組配”現象下隱含著“分解”。

因此,多維分面的分解必須科學,必須具有理論的指導,否則為分解而分解。

缺少目的性。目前在國際電子文件管理領域,電子文件管理元數據多維分面化架構其分解都是基于電子文件管理連續體理論來進行的。如前所述,將電子文件元數據系統,分解為文件面、責任者面和業務處置面,其理論根據主要是依據電子文件管理連續體理論的三個實體來劃分的,即依據文件管理連續體理論的文件實體軸形成文件面、責任者實體軸形成責任者面、業務處置實體軸形成業務處置面,所以,將電子文件管理元數據分解為文件面、責任者面和業務處置面是具有其內在的科學性的。不僅如此,由于多維分面化架構的科學性,因而其形成的分面架構又被國際電子文件元數據管理領域所共同認可,并進而被國際標準化組織(ISO)所制定的國際標準《ISO23081-1信息與文件—文件管理過程—文件元數據—第一部分:原則》所采納,從而成為國際標準的多維分面架構。

由此可見,電子文件管理元數據多維分面化架構具有很明顯的優勢:

(1)依據電子文件管理連續體的基本理論進行面的多維分解,符合電子文件管理的規律,具有科學性與理論基礎。

(2)采用面的多維組配,可靈活地組配形成所需的各種電子文件管理元數據,從而可多維地、全面地反映電子文件特征,因而功能更加強大。

(3)采用多維分面架構,優化了電子文件管理元數據的宏觀架構,促進了電子文件管理元數據的宏觀架構的標準化,因而十分有益于電子文件真實性、可靠性、完整性和可利用性及法律憑證價值的實現。

綜上所述,通過以上對電子文件管理元數據單一線型結構和多維分面結構的比較分析可看出,單一線型結構存在數據冗余、體系龐大、專指度不高等缺陷,還需要進一步完善,而多維分面架構卻有顯著的優點,其采用分面的方法,使得電子文件管理元數據能更加靈活地運用,能更加多維地全面地揭示電子文件的屬性,能更加完整地反映電子文件之間的關系,因此,在電子文件領域,多維分面方法是值得充分重視與研究的,同樣,在我國電子文件管理元數據宏觀架構的制定過程中,也應積極采用多維分面化架構,從而提高我國電子文件管理元數據標準化程度,提高對電子文件資源開發與利用的效率.

【參考文獻】

[1]張琪玉,《情報語言學基礎》,1987年

[2]童時中,《模塊化原理設計方法及應用》,2000年