§ 瀏覽學位論文書目資料
  
系統識別號 U0002-2401201612055800
DOI 10.6846/TKU.2016.00765
論文名稱(中文) 數位資訊保存格式辨識工具之探討
論文名稱(英文) The Study of Digital Information Preservation Tools on Format Identification
第三語言論文名稱
校院名稱 淡江大學
系所名稱(中文) 資訊與圖書館學系碩士班
系所名稱(英文) Department of Information and Library Science
外國學位學校名稱
外國學位學院名稱
外國學位研究所名稱
學年度 104
學期 1
出版年 105
研究生(中文) 劉承達
研究生(英文) Cheng-Ta Liu
學號 698000162
學位類別 碩士
語言別 繁體中文
第二語言別
口試日期 2016-01-12
論文頁數 84頁
口試委員 指導教授 - 歐陽崇榮
委員 - 盧以詮
委員 - 鄭雅穗
關鍵字(中) 辨識工具
數位保存
格式
關鍵字(英) Metadata Extraction Tool
Droid
Format Identification
Digital Preservation
第三語言關鍵字
學科別分類
中文摘要
以系統實作,來比較分析兩套辨識工具之效能:Droid以及Metadata Extraction Tool;並且以文獻探討,以學術單位之檔案文件為案例作為電子檔案版本之研究。
以實作結果歸納成果如下:
一、 目前存在的軟體版本在讀取上是沒有問題。但是在開放性上還需再多方研擬。
二、 在實測後,Droid在顯示上較為簡潔,在辨識的能力上比較寬廣。Metadata Extraction Tool在資料的儲存上比較便利,在呈現上是屬於開放式xml格式。
英文摘要
With system implementation, this study compares the performance of two tools for file format identification, namely, Droid and Metadata Extraction Tool. After reviewing the literatures, archive files of academic institutions were used as example to examine versions of electronic archives.
1. The existing versions of the software are good for reading archives, but more works should be done to improve the openness.
2. Our test showed that Droid is more concise in display and has a broader range of identification, while Metadata Extraction Tool is more convenient for saving data and use the xml format for display.
第三語言摘要
論文目次
目次 I
圖目錄 III
表目錄 VI
第一章 緒論                                  1
第一節 研究背景與動機                                              1
第二節 研究目的與問題                                               2
第三節 研究範圍與限制                                                3
第四節 名詞解釋                                                3
第二章 文獻探討                                  5
第一節 電子檔案儲存格式                                                 5
第二節 數位資訊保存國外情況                                                  7
第三節 數位資訊保存國內情況                                                22
第四節 保存辨識工具                                                 25
第三章 研究方法                                   31
第一節 文獻分析法                                                  31
第二節 系統實測及安裝                                                   31
第三節 研究架構                                                   34
第四章 實作比較                                     37
第一節 數位檔案整析                                                   37
第二節 DROID                                                   43
第三節 METADATA EXTRACTION TOOL                                                 64
第四節 綜合結論                                                 76
第五章 結論                                      79
第一節 研究結論                                                  79
第二節 研究建議                                                  80
參考文獻:                                        83

圖目錄
圖 2-1 英國檔案局積極性長期保存                                                          9
圖 2-2 DROID                                                                                           10
圖 2‐3 ERA 架構                                                                                         12
圖2-4 Metadata Extraction Tool 啟動頁面                                               27
圖2- 5 DROID 啟動畫面                                                                          28
圖2- 6 Droid 開啟                                                                                      32
圖2- 7 Metadata Extraction Tool 開啟                                                     33
圖 3‐8 研究流程圖                                                                                    35
圖 4-9 資料類型數量統計圖(總量)                                                         39
圖 4-10 資料類型數量統計圖1(文學院A 系)                                        40
圖 4-11 資料類型數量統計圖2(文學院A 系)                                        40
圖 4-12 資料類型數量統計圖1(工學院B 系)                                        41
圖 4-13 資料類型數量統計圖2(工學院B 系)                                        41
圖 4-14 兩系資料類型數量比例圖                                                          42
圖 4-15 載入檔案類型:WORD                                                                 43
圖 4-16 WORD 辨識結果                                                                         44
圖 4-17 WORD 辨識版本                                                                         44
圖 4-18 詳細資料網頁連結                                                                      45
圖 4-19 詳細資料網頁1                                                                           46
圖 4-20 詳細資料網頁2                                                                           47
圖 4-21 PDF 辨識結果                                                                              48
圖 4-22 PDF 辨識版本                                                                              48
圖 4-23 PDF 辨識網頁詳細資料1                                                           49
圖 4-24 PDF 辨識網頁詳細資料2                                                           50
圖 4-25 PDF 版本比例                                                                              51
圖 4-26 ppt 辨識結果                                                                               51
圖 4-27 ppt 辨識版本                                                                               52
圖 4-28 ppt 網頁詳細1                                                                             53
圖 4-29 ppt 網頁詳細2                                                                             54
圖 4-30 試算表辨識結果                                                                          55
圖 4-31 試算表辨識版本                                                                          55
圖 4-32 試算表網頁詳細1                                                                       56
圖 4-33 試算表網頁詳細2                                                                       57
圖 4-34 其他類型檔案測試結果                                                              58
圖 4-35 其他類型檔案測試版本                                                              58
圖 4-36 其他類型檔案網頁詳細1                                                           59
圖 4-37 其他類型檔案網頁詳細2                                                           60
圖 4-38 其他類型檔案網頁詳細3                                                           61
圖 4-39 其他類型檔案網頁詳細4                                                           62
圖 4-40 其他類型檔案網頁詳細5                                                           63
圖 4-41 word 辨識結果                                                                             64
圖 4-42 word 辨識勘錯                                                                             65
圖 4-43 word 資料辨識成功比例圖                                                         65
圖 4-44 word 詳細內容xml 呈現                                                             66
圖 4-45 pdf 測試結果                                                                                67
圖 4-46 pdf 測試版本1                                                                             68
圖 4-47 pdf 測試版本2                                                                             69
圖 4-48 ppt 測試結果                                                                                70
圖 4-49 ppt 測試版本1                                                                             70
圖 4-50 ppt 測試版本2                                                                             71
圖 4-51 試算表測試結果                                                                          72
圖 4-52 試算表測試版本1                                                                       72
圖 4-53 試算表測試版本2                                                                       73
圖 4-54 其他類型資料測試結果                                                              74
圖 4-55 其他類型資料測試版本1                                                           74
圖 4-56 其他類型資料測試2                                                                   75
圖 4-57 Metadata Extraction Tool 存檔                                                   77
圖 4-58 Droid 存檔                                                                                 77

表目錄
表 2- 1 電子檔案格式表                                                                             6
表 2- 2 Metadata Extraction Tool 分項簡介                                            26
表 4-3 資料類型與數量                                                                            38
表 4-4 辨識工具特色                                                                                78
參考文獻
Adrienne Muir,”Legal Deposit of Digital Publications”.
Archives New Zealand ,http://archives.govt.nz/(accessed Dec 10,2015).
Digital Preservation Coalition,”Preservation Metadata,”4.
National Archive of Australia, Digital Preservation Software ,http://Xena.sourceforge.net/(accessed Nov 02,2015).
National Archive of UK"http://www.nationalarchives.gov.uk/information-management/manage-information/preserving-digital-records/droid/"( accessed Nov 1,2015).
National Archives of Australia, “The Collection,”http://www.naa.gov.au/collection/(accessed Nov 13,2015).
National Library of New Zwaland"http://meta-extractor.sourceforge.net/"( accessed Nov 1,2015).
PORTICO" Portico Format Monitoring and Migration Policy".(2009).
PORTICO"A Format-Registry-Based Automated Workflow for the Ingest and Preservation,"of Electronic Journals,.(2005).
PORTICO," http://openpreservation.org/about/members/portico/"( accessed Nov 13,2015).
Public Record Office Victoria, ”Specification 1 System Requirements for Archiving Electronic Records,”http://210.8.122.120/vers/standard/ver1/99-7-1.pdf(accessed Nov 5,2015).
Robin Wendler,”The Statue of Preservation Metadata in the Digital Library Community,”in Digital Preservation,.(2006):61-64.
The National Archives, “Records,” http://www.nationalarchives.gov.uk/default.htm(accessed Nov 10,2015).
The U.S. National Archives and Records Administration, “Electronic Records Archives(ERA),”http”//www.archives.gov/era/(accessed Nov 13,2015).
Wendler,Robin,"The Statue of Preservation Metadata in the Digital Library Community,"in Digital Preservation,.(2006):61-64.
王文英,「淺談保存後設資料」。圖書與資訊學刊59期(民95年11月),頁75-91。
項潔、陳雪華,「各國檔案數位化之探討」,檔案季刊 3:3 (民國93年9月):頁1-20。
趙培因,「電子檔案長期保存架構」。檔案季刊,7(2),(民97年6月):頁34-43。
劉佳琳,「美、英、澳三國電子檔案管理制度介紹」,檔案季刊,5卷2期,(民95年6月):130-139。
歐陽崇榮,「數位資訊保存策略」。(台北市,文華,民96年),頁118。
歐陽崇榮,「辦公室電子文件長期保存格式之探討」,檔案季刊,6(3),(民96年9月):頁72-87。
檔案管理局,「各國電子公文檔案管理實施情形」,http://wiki.archives.gov.tw/index.php/97-107?id=726 (檢索於2015年11月25日)。
檔案管理局,「電子檔案管理機制」,http://wiki.archives.gov.tw/index.php/en?option=com_conten&view=article&id=946&Itemid=108(檢索於2015年11月08日)。
檔案管理局,檔案法令彙編,檔案管理局編印,民94年10月,頁137。
薛理桂、黃國斌,「淺談電子文件鑑定」,檔案季刊一卷二期,頁22。
論文全文使用權限
校內
校內紙本論文立即公開
同意電子論文全文授權校園內公開
校內電子論文立即公開
校外
同意授權
校外電子論文立即公開

如有問題,歡迎洽詢!
圖書館數位資訊組 (02)2621-5656 轉 2487 或 來信