§ Browsing ETD Metadata
  
System No. U0002-2401201612055800
Title (in Chinese) 數位資訊保存格式辨識工具之探討
Title (in English) The Study of Digital Information Preservation Tools on Format Identification
Other Title
Institution 淡江大學
Department (in Chinese) 資訊與圖書館學系碩士班
Department (in English) Department of Information and Library Science
Other Division
Other Division Name
Other Department/Institution
Academic Year 104
Semester 1
PublicationYear 105
Author's name (in Chinese) 劉承達
Author's name(in English) Cheng-Ta Liu
Student ID 698000162
Degree 碩士
Language Traditional Chinese
Other Language
Date of Oral Defense 2016-01-12
Pagination 84page
Committee Member advisor - James C.Ouyang
co-chair - Yi-Chuan Lu
co-chair - Hilary Cheng
Keyword (inChinese) 辨識工具
數位保存
格式
Keyword (in English) Metadata Extraction Tool
Droid
Format Identification
Digital Preservation
Other Keywords
Subject
Abstract (in Chinese)
以系統實作,來比較分析兩套辨識工具之效能:Droid以及Metadata Extraction Tool;並且以文獻探討,以學術單位之檔案文件為案例作為電子檔案版本之研究。
以實作結果歸納成果如下:
一、 目前存在的軟體版本在讀取上是沒有問題。但是在開放性上還需再多方研擬。
二、 在實測後,Droid在顯示上較為簡潔,在辨識的能力上比較寬廣。Metadata Extraction Tool在資料的儲存上比較便利,在呈現上是屬於開放式xml格式。
Abstract (in English)
With system implementation, this study compares the performance of two tools for file format identification, namely, Droid and Metadata Extraction Tool. After reviewing the literatures, archive files of academic institutions were used as example to examine versions of electronic archives.
1. The existing versions of the software are good for reading archives, but more works should be done to improve the openness.
2. Our test showed that Droid is more concise in display and has a broader range of identification, while Metadata Extraction Tool is more convenient for saving data and use the xml format for display.
Other Abstract
Table of Content (with Page Number)
目次 I
圖目錄 III
表目錄 VI
第一章 緒論                                  1
第一節 研究背景與動機                                              1
第二節 研究目的與問題                                               2
第三節 研究範圍與限制                                                3
第四節 名詞解釋                                                3
第二章 文獻探討                                  5
第一節 電子檔案儲存格式                                                 5
第二節 數位資訊保存國外情況                                                  7
第三節 數位資訊保存國內情況                                                22
第四節 保存辨識工具                                                 25
第三章 研究方法                                   31
第一節 文獻分析法                                                  31
第二節 系統實測及安裝                                                   31
第三節 研究架構                                                   34
第四章 實作比較                                     37
第一節 數位檔案整析                                                   37
第二節 DROID                                                   43
第三節 METADATA EXTRACTION TOOL                                                 64
第四節 綜合結論                                                 76
第五章 結論                                      79
第一節 研究結論                                                  79
第二節 研究建議                                                  80
參考文獻:                                        83

圖目錄
圖 2-1 英國檔案局積極性長期保存                                                          9
圖 2-2 DROID                                                                                           10
圖 2‐3 ERA 架構                                                                                         12
圖2-4 Metadata Extraction Tool 啟動頁面                                               27
圖2- 5 DROID 啟動畫面                                                                          28
圖2- 6 Droid 開啟                                                                                      32
圖2- 7 Metadata Extraction Tool 開啟                                                     33
圖 3‐8 研究流程圖                                                                                    35
圖 4-9 資料類型數量統計圖(總量)                                                         39
圖 4-10 資料類型數量統計圖1(文學院A 系)                                        40
圖 4-11 資料類型數量統計圖2(文學院A 系)                                        40
圖 4-12 資料類型數量統計圖1(工學院B 系)                                        41
圖 4-13 資料類型數量統計圖2(工學院B 系)                                        41
圖 4-14 兩系資料類型數量比例圖                                                          42
圖 4-15 載入檔案類型:WORD                                                                 43
圖 4-16 WORD 辨識結果                                                                         44
圖 4-17 WORD 辨識版本                                                                         44
圖 4-18 詳細資料網頁連結                                                                      45
圖 4-19 詳細資料網頁1                                                                           46
圖 4-20 詳細資料網頁2                                                                           47
圖 4-21 PDF 辨識結果                                                                              48
圖 4-22 PDF 辨識版本                                                                              48
圖 4-23 PDF 辨識網頁詳細資料1                                                           49
圖 4-24 PDF 辨識網頁詳細資料2                                                           50
圖 4-25 PDF 版本比例                                                                              51
圖 4-26 ppt 辨識結果                                                                               51
圖 4-27 ppt 辨識版本                                                                               52
圖 4-28 ppt 網頁詳細1                                                                             53
圖 4-29 ppt 網頁詳細2                                                                             54
圖 4-30 試算表辨識結果                                                                          55
圖 4-31 試算表辨識版本                                                                          55
圖 4-32 試算表網頁詳細1                                                                       56
圖 4-33 試算表網頁詳細2                                                                       57
圖 4-34 其他類型檔案測試結果                                                              58
圖 4-35 其他類型檔案測試版本                                                              58
圖 4-36 其他類型檔案網頁詳細1                                                           59
圖 4-37 其他類型檔案網頁詳細2                                                           60
圖 4-38 其他類型檔案網頁詳細3                                                           61
圖 4-39 其他類型檔案網頁詳細4                                                           62
圖 4-40 其他類型檔案網頁詳細5                                                           63
圖 4-41 word 辨識結果                                                                             64
圖 4-42 word 辨識勘錯                                                                             65
圖 4-43 word 資料辨識成功比例圖                                                         65
圖 4-44 word 詳細內容xml 呈現                                                             66
圖 4-45 pdf 測試結果                                                                                67
圖 4-46 pdf 測試版本1                                                                             68
圖 4-47 pdf 測試版本2                                                                             69
圖 4-48 ppt 測試結果                                                                                70
圖 4-49 ppt 測試版本1                                                                             70
圖 4-50 ppt 測試版本2                                                                             71
圖 4-51 試算表測試結果                                                                          72
圖 4-52 試算表測試版本1                                                                       72
圖 4-53 試算表測試版本2                                                                       73
圖 4-54 其他類型資料測試結果                                                              74
圖 4-55 其他類型資料測試版本1                                                           74
圖 4-56 其他類型資料測試2                                                                   75
圖 4-57 Metadata Extraction Tool 存檔                                                   77
圖 4-58 Droid 存檔                                                                                 77

表目錄
表 2- 1 電子檔案格式表                                                                             6
表 2- 2 Metadata Extraction Tool 分項簡介                                            26
表 4-3 資料類型與數量                                                                            38
表 4-4 辨識工具特色                                                                                78
References
Adrienne Muir,”Legal Deposit of Digital Publications”.
Archives New Zealand ,http://archives.govt.nz/(accessed Dec 10,2015).
Digital Preservation Coalition,”Preservation Metadata,”4.
National Archive of Australia, Digital Preservation Software ,http://Xena.sourceforge.net/(accessed Nov 02,2015).
National Archive of UK"http://www.nationalarchives.gov.uk/information-management/manage-information/preserving-digital-records/droid/"( accessed Nov 1,2015).
National Archives of Australia, “The Collection,”http://www.naa.gov.au/collection/(accessed Nov 13,2015).
National Library of New Zwaland"http://meta-extractor.sourceforge.net/"( accessed Nov 1,2015).
PORTICO" Portico Format Monitoring and Migration Policy".(2009).
PORTICO"A Format-Registry-Based Automated Workflow for the Ingest and Preservation,"of Electronic Journals,.(2005).
PORTICO," http://openpreservation.org/about/members/portico/"( accessed Nov 13,2015).
Public Record Office Victoria, ”Specification 1 System Requirements for Archiving Electronic Records,”http://210.8.122.120/vers/standard/ver1/99-7-1.pdf(accessed Nov 5,2015).
Robin Wendler,”The Statue of Preservation Metadata in the Digital Library Community,”in Digital Preservation,.(2006):61-64.
The National Archives, “Records,” http://www.nationalarchives.gov.uk/default.htm(accessed Nov 10,2015).
The U.S. National Archives and Records Administration, “Electronic Records Archives(ERA),”http”//www.archives.gov/era/(accessed Nov 13,2015).
Wendler,Robin,"The Statue of Preservation Metadata in the Digital Library Community,"in Digital Preservation,.(2006):61-64.
王文英,「淺談保存後設資料」。圖書與資訊學刊59期(民95年11月),頁75-91。
項潔、陳雪華,「各國檔案數位化之探討」,檔案季刊 3:3 (民國93年9月):頁1-20。
趙培因,「電子檔案長期保存架構」。檔案季刊,7(2),(民97年6月):頁34-43。
劉佳琳,「美、英、澳三國電子檔案管理制度介紹」,檔案季刊,5卷2期,(民95年6月):130-139。
歐陽崇榮,「數位資訊保存策略」。(台北市,文華,民96年),頁118。
歐陽崇榮,「辦公室電子文件長期保存格式之探討」,檔案季刊,6(3),(民96年9月):頁72-87。
檔案管理局,「各國電子公文檔案管理實施情形」,http://wiki.archives.gov.tw/index.php/97-107?id=726 (檢索於2015年11月25日)。
檔案管理局,「電子檔案管理機制」,http://wiki.archives.gov.tw/index.php/en?option=com_conten&view=article&id=946&Itemid=108(檢索於2015年11月08日)。
檔案管理局,檔案法令彙編,檔案管理局編印,民94年10月,頁137。
薛理桂、黃國斌,「淺談電子文件鑑定」,檔案季刊一卷二期,頁22。
Terms of Use
Within Campus
On-campus access to my hard copy thesis/dissertation is open immediately
Agree to authorize disclosure on campus
Release immediately
Outside the Campus
I grant the authorization for the public to view/print my electronic full text with royalty fee and I donate the fee to my school library as a development fund.
Release immediately
 Top

If you have any questions, please contact us!

Library: please call (02)2621-5656 ext. 2487 or email