摘 要:針對勘察設計企業的數字檔案館建設技術,提出從基礎設施層、數據層和應用層進行整體架構設計,并完善相應的規范保障體系。通過應用OCR技術實現歷史存量紙質檔案的數字化,從而將歷史檔案盤活。根據OAIS參考模型定義的業務實體和功能實體,圍繞檔案生產者、消費者和管理者構造檔案存儲體系,并實現業務系統電子文件在線歸檔至檔案系統。最后對數字檔案館的基礎建設、進階管理以及知識挖掘三個建設階段進行了探討與分析。
關鍵詞:勘察設計企業;數字檔案館;數字資源;檔案系統
0 引言
企業檔案是指企業在生產經營管理活動中形成的對國家、社會和企業有保存價值的各種形式的文件材料。隨著企業規模以及經營業務的不斷發展壯大,企業各種類型檔案如工程項目檔案、財務檔案、科技檔案會越來越多。這些檔案是企業知識與經驗的傳承,見證了企業的成長,是企業寶貴的財富。
勘察設計行業作為典型的知識密集型行業,其工程項目具有較高的技術含量。檔案作為工程項目知識的積累與沉淀,具有較高的利用價值。但現狀是勘察設計企業經營者往往只重視項目的經營管理與技術質量管理,卻忽視了最后的設計成果歸檔環節。雖然在工程項目開展過程中應用了較為先進的設計軟件、項目管理系統,但項目檔案的歸檔依舊采用較為落后的方式,導致檔案管理和利用效率較低,信息資源開發嚴重不足,無法滿足企業生產經營、知識利用和戰略決策的需求。因此,建設數字檔案館,利用信息化手段大幅度提升檔案管理的效率和質量,發掘企業的隱含知識,是勘察設計企業知識化管理的重要途徑。
1 勘察設計企業檔案管理問題分析
1.1 歷史檔案數量大,難以管理
大型勘察設計企業往往歷史較為悠久,館藏檔案數量巨大。受制于以往信息技術發展水平的限制,勘察設計企業存量檔案中紙質檔案占絕大多數。由于紙張在長期保管、利用過程中會因各種因素影響而不斷老化、變質、易損壞,一旦管理不善,會使眾多的歷史檔案失去珍藏和利用價值,增加了企業的管理成本。
1.2 項目周期長,變更頻繁
勘察設計項目的周期通常比較長,其中涉及的專業也比較多,而在設計過程中往往會因為工程建設條件、外部環境以及工程實施過程中各參建方的主觀意見等因素導致設計變更。由于傳統的檔案管理系統缺乏與其他業務系統數據聯動、在線歸檔的技術支持,勘察設計項目負責人很難將項目的完整材料進行整理歸檔,項目檔案容易缺失。
1.3 設計文件缺乏統一歸檔規范
勘察設計項目傳統的設計出圖過程,是各專業設計人員使用各自的繪圖軟件繪制工程圖紙,再由校審人員審批形成最終成果。但由于設計制圖軟件版本眾多,且缺乏與檔案系統的有效連接,導致勘察項目的各類設計文件存在大量不規范、不統一的問題,增加了檔案管理、利用的難度。
1.4 知識利用率低
傳統檔案管理模式下,往往以工程項目為歸檔單元進行檔案搜集。雖然方便了項目檔案的管理工作,但由于檔案館員往往不具備勘察設計專業知識,缺乏對檔案知識標簽的梳理,因此難以形成較為完善的知識圖譜,檔案利用價值較低,項目經驗難以復用。
2 數字檔案館建設整體架構
如圖1所示,為解決勘察設計企業檔案管理存在的問題,數字檔案館的建設應涵蓋基礎設施層、數據層和應用層,并完善相應的標準規范體系和安全保障體系。
2.1 基礎設施層
基礎設施層應包含支撐數字檔案館運行的中心機房、網絡平臺、服務器、存儲設備、終端設備及其他軟硬件設備。有條件的企業可以同時配合搭建智能檔案庫房,通過智能化控制,實現對實體檔案的無序存放、有序管理。
2.2 數據層
數據層包含檔案資源數據庫,以及編研形成的各項專題數據庫。該層的設計應以檔案資源的高效管理和利用為導向,搭建以NoSQL為基礎的分布式檔案存儲系統。通過對檔案元數據、數據分布、數據采集以及知識標簽的梳理,構建項目檔案的知識圖譜,為檔案知識化應用提供數據支撐。
2.3 應用層
應用層應在數據層的基礎上,建設實現勘察設計項目全生命周期管理的數字檔案系統。利用微服務+Docker容器化技術實現檔案收集、整理、保存等功能,并同智能庫房連通,實現電子檔案與實物檔案的一體化管理。
2.4 標準規范體系與安全保障體系
數字檔案館的建設離不開相應的規范體系支撐,應制定包含檔案收集、整理、保管、利用等方面的標準規范體系及實施要求。同時還要建立健全基礎設施、軟件系統、網絡等方面的安全保障體系以及企業保密管理條例。
3 關鍵技術
3.1 數字資源建設
數字資源建設應從兩個方面入手:一是要實現歷史存量紙質檔案的數字化;二是要實現增量電子檔案的移交入庫。為了將歷史檔案盤活,檔案的數字化不能僅僅是完成掃描工作,還需要借助OCR技術獲得可檢索的數字化副本。這個過程需要對圖紙內容進行識別、標引、入庫等電子化加工,并對圖紙中圖像進行建庫檢索、智能差異比對、版面還原,再配合索引數據庫、全文檢索等技術構建圖文檢索管理系統,實現數字資源的高效利用。
3.2 數字檔案系統建設
如圖3所示,數字檔案系統的建設應根據OAIS參考模型定義的業務實體和功能實體,圍繞檔案生產者、消費者和管理者構造檔案存儲體系。其中生產者和消費者是指提供檔案和利用檔案的個人或組織。如項目檔案的生產者是承擔工程項目的各項目組,項目檔案的消費者為其他需要借鑒學習的項目組或新入職的員工。管理者通常作為檔案管理機構,負責制定檔案歸檔范圍、歸檔流程等標準體系。數字檔案系統應圍繞這三個業務實體定義檔案收集、數據管理、檔案存儲、檔案利用、保存規劃、系統管理6個功能實體來完成整個檔案管理流程。
推薦閱讀:檔案管理方面的著作怎么出版
論文指導 >
SCI期刊推薦 >
論文常見問題 >
SCI常見問題 >