§ 瀏覽學位論文書目資料
  
系統識別號 U0002-0707200516525300
DOI 10.6846/TKU.2005.00088
論文名稱(中文) 以語意為基礎的RDF標示及查詢網頁之網路服務研究與實作
論文名稱(英文) The Research and Implementation of Semantic Based RDF Tagging and Webpage Searching Web Service
第三語言論文名稱
校院名稱 淡江大學
系所名稱(中文) 資訊工程學系碩士班
系所名稱(英文) Department of Computer Science and Information Engineering
外國學位學校名稱
外國學位學院名稱
外國學位研究所名稱
學年度 93
學期 2
出版年 94
研究生(中文) 邱茂順
研究生(英文) Mao-Shuen Chiu
學號 692192148
學位類別 碩士
語言別 繁體中文
第二語言別
口試日期 2005-06-06
論文頁數 98頁
口試委員 指導教授 - 許輝煌
委員 - 施國琛
委員 - 洪啟舜
關鍵字(中) 語意網
字網
資源描述語言框架結構
網路服務
關鍵字(英) Semantic Web
WordNet
RDF
Web Service
第三語言關鍵字
學科別分類
中文摘要
近幾年來,網路資訊技術不斷的進步與成熟,常透過網路來搜尋欲尋找的資料或文件,大多數這些文字的資訊搜尋方法,依賴於使用者的要求的詞彙以及搜尋目標物的詞彙之間的詞彙比對(關鍵字比對)。通常只有在使用者的查詢中包含一個或更多與目標物共同的詞彙才會被判斷為有關。然而以詞彙為基礎的檢索搜尋系統離理想有一段差距。主要的因素不外是語意上的判別以及詞彙間關連性等問題。
  目前致力開發語意網(Semantic Web)的單位相當多,此項技術也正慢慢開始發展中。W3C(World Wide Web Consortium)明確的告訴我們,Web的未來是具有語意化的(Semantic Web),今天的Web可以自如地生成、傳遞和展現各式各樣的資訊,但它還只是一個資訊的"容器"(Container),很難揭示出資訊本身的內容和特性。與此相對的是,未來的語意化Web是一種懂得資訊內容的Web,是真正的"資訊管理員"。W3C的研究小組提出了RDF(Resource Description Framework)標準規格。RDF在XML語法的基礎上,規定了Metadata的儲存結構和相關的技術標準。隨著語意化Web的誕生和發展,Web開發技術也必將經歷更為重大的變革。這些都是為了讓更多的人獲得更有價值的資訊服務,故資訊共用的最高目標,語意網也因此逐步成為未來網路的主流。
因此,本研究將利用我們先前所提出的「以語意方式搜尋網頁之系統」,加上利用RDF資源描述語言的格式,用WordNet中的Synset(同義字集)的觀念(concept)來註解/標示網頁的前後文的語意內容,將查詢結果訂定在同一個標準下,並使用RDF語言的特性,我們可以用統一的、可交換的格式來表示出資訊本身的各種特性。在RDF語言的幫助下,我們能讓Web上的資訊內容變得更容易理解、更便於交換和共用。此外,我們研究在Web Service中加入語意的技術。以及N3(Three Triples)的特性將各個網路/網頁資源(Resources)以及與其他資源的關聯性標記/架構出來,可透過其查詢語言來找尋欲查找的資料,最後建置一語意網路服務(Semantic Web Service)的機制,以達到可供語意查詢和分享的目的。
英文摘要
In recent years, the network and information technology is more and more ripe we always search for data or files through the Internet. The resources on the World Wide Web are increased day by day. The amount of information exchange and speed of update are also grown. Many methods depend on the match of vocabularies between information request and searched objects. For example, we usually adopt some keywords and Boolean operators to form the query to search the Internet for interested information. Unfortunately, users do not always use proper words and operators to form the query for the search. The result is related or unrelated information is both retrieved .The retrieval method becomes critical for us to get more accurate results. In order to improve the searching process, a RDF-based mechanism integrated with word sense disambiguation technique is proposed to semantically index and retrieve web pages on the World Wide Web. The approach is to describe the resources by RDF(S) metadata and store them. The proposed method also has additional advantage of the ability of further integrated into the Semantic Web Service.
第三語言摘要
論文目次
目錄......................................................i
第一章 緒論...............................................1
1.1 研究動機與目的.....................................1
1.2 系統簡介..........................................10
1.3 論文組織及架構....................................11
第二章 相關研究工作及文獻探討............................12
2.1 相關研究工作......................................12
2.1.1 XML.........................................12
2.1.2 Metadata....................................13
2.1.3 Dublin Core.................................15
2.1.4 RDF.........................................17
2.1.5 RDFS........................................28
2.2 相關文獻探討......................................32
第三章 系統架構規劃與RDF標示及查詢網頁之策略............35
3.1 系統架構與規劃....................................35
3.1.1 系統規劃....................................35
3.1.2 系統架構與步驟..............................37
3.2 RDF標示及查詢網頁之策略...........................39
3.2.1 轉換方法....................................40
3.2.2 參照WordNet/RDF Schema......................45
3.2.3 RDF Parsing and Tagging.......................51
3.2.4 RDF Model and Storage.........................58
第四章 系統實作..........................................60
4.1 系統實作技術研究與開發環境........................61
4.1.1 RDF Query Language...........................61
4.1.2 Web Service.................................67
4.1.3 系統開發環境介紹............................69
4.2 系統實作方法......................................75
4.2.1 整合Web Service.............................75
4.2.2 資料庫之模組與建置..........................81
4.2.3 系統流程操作................................83
第五章 研究結論與未來展望................................93
5.1 研究結論與貢獻....................................93
5.2 未來展望與期許....................................94
參考文獻................................................R-1
附錄 英文論文...........................................A-1

圖目錄
第一章
圖1-1 W3C Recommendations.................................7
第二章
圖2-1 描述Metadata方法之架構............................15
圖2-2 使用Dublin Core Property來描述網頁.................17
圖2-3 RDF基本資料模型....................................23
圖2-4 RDF Model範例(dc:Creator)..........................25
圖2-5 aboutEachPrefix範例................................28
圖2-6 Resource中的Class、Property與Constraint關係........29
圖2-7 RDF Schema類別的階層圖.............................30
圖2-8 MotorVehicle關係圖之範例...........................31
圖2-9 RDF Schema中的限制關係圖...........................31
圖2-10 XML、RDF/XML與XML Namespace在資源描述的關係.......34
圖2-11 語意語言之發展架構圖(圖片來源:W3C網站)...........34
第三章
圖3-1 系統架構圖.........................................37
圖3-2 Semantic mapping between Wordnet and web pages.....46
圖3-3 The semantic relations of Wordnet in RDF...........47
圖3-4 Book字彙與其查找網址結果之關聯性(RDF Model)........49
圖3-5 Ticket字彙與其查找網址結果之關聯性(RDF Model)......50
圖3-6 Train字彙與其查找網址結果之關聯性(RDF Model).......51
圖3-7 利用搜尋引擎查詢book、ticket和train後之網頁........52
圖3-8 將此網頁轉成XML之格式.............................53
圖3-9 將此網頁透過RSS轉成RDF Format.....................53
圖3-10 Graph of the RDF Data Model.......................56
圖3-11 RDF標籤網頁於資料庫...............................57
第四章
圖4-1 Jena輸出-在提示命令列底下查詢RDF之結果............63
圖4-2 The system flow chart..............................65
圖4-3 Google API searching...............................66
圖4-4 Parsing Web-Pages..................................67
圖4-5 MySQL介面..........................................67
圖4-6 Web Service系統圖解................................69
圖4-7 使用JAX-RPC開發Web Service........................71
圖4-8 JAX-RPC運作原理....................................72
圖4-9 JAXR執行環境之運作原理.............................73
圖4-10 Web Service 介面..................................75
圖4-11 Metadata編輯處理介面..............................76
圖4-12 資料庫系統管理介面................................81
圖4-13 詳列出資料庫內之資料欄位表格......................82
圖4-14 新增ID, Synset, Address至資料庫系統...............82
圖4-15 JWSDP系統管理介面.................................83
圖4-16 Administration系統管理畫面........................84
圖4-17 JWSDP Web Application Manager畫面.................85
圖4-18 Deploy及WAR檔案設定..............................85
圖4-19 Java Web Services Developer Pack 1.4系統畫面......86
圖4-20 系統查詢頁面......................................87
圖4-21 Main Memory RDF repository........................87
圖4-22 RDQL介面..........................................88
圖4-23 RDF Document for query............................89
圖4-24 RDQL操作範例......................................90
圖4-25 RDQL操作流程圖....................................90
圖4-26 使用RDQL來查詢已儲存之RDF文件....................91
圖4-27 HTML格式輸出......................................91
圖4-28 XML格式輸出.......................................92
圖4-29 RDF格式輸出.......................................92
表目錄
第二章
表2-1 利用RDF來描述此句子之語法.........................25
表2-2 aboutEachPrefix之實例..............................27
表3-1 HTML網頁原始碼範例.................................43
表3-2 HTML轉成RSS1.0格式後之範例........................44
表3-3 轉換後之RDF文件片段如下...........................54
表3-4 文件轉換後的RDF Model之N-Triples格式..............55
表4-1 RDF表示敘述句之語法...............................62
表4-2 StockQuote.xml.....................................78
表4-3 Web.xml............................................79
表4-4 WebService-binding.wsdl............................80
參考文獻
[1]W3C, World Wide Web Consortium  htttp://www.w3.org/
[2]WordNet  http://www.cogsci.princeton.edu/~wn/
[3]Google API  http://www.google.com.tw/apis/
[4]Sesame  http://www.openrdf.org/
[5]Jena  http://jena.sourceforge.net/
[6]RSS 1.0  http://purl.org/rss/1.0/
[7]HP Labs Semantic Web Programme http://www.hpl.hp.com/semweb/
[8]XML台灣資訊網  http://www.xml.org.tw/
[9]ACADEMIA Sinica Computing Center  http://www.ascc.net/
[10]Jason C. Hung, Ching-Sheng Wang, Che-Yu Yang, Mao-Shuen Chiu, George Yee, “Applying Word Sense Disambiguation to Question Answering System for E-Learning”, International Conference on Advanced Information Networking and Applications (AINA 2005).
[11]Boris Katz, Jimmy Lin, and Sue Felshin. 2001. “Gathering knowledge for a question answering system from heterogeneours information sources. ” In Proceedings of the ACL 2000 Workshop on Human Language Technology and Knowledge Management.
[12]Tim Berners-Lee, James Hendler, and Ora Lassila, 2001, “The Semantic Web, ” Scientific American, 284(5):34-43.
[13]Tim Berners-Lee, 2000. “Primer: Getting into RDF and Semantic Web using N3”.
[14]H. Alani, S. Kim, D.E. Millard, M.J. Weal, W. Hall, P.H. Lewis, and N.R. Shadbolt, “Automatic ontology-based knowledge extraction from web documents, ” IEEE Intelligent Systems, vol.18, no. 1, Jan/Feb 2003, pp. 14-21
[15]“The Yin/Yang Web: XML Syntax and RDF Semantics,” WWW 2002, May 7-11, 2002, Honolulu, Hawaii, USA. ACM 1-58113-449-5/02/0005.
[16]M.Klein, “XML, RDF, and Relatives,” IEEE Intelligent Systems, vol. 16, no.2, Mar/Apr 2001, pp. 26-28
[17]F. Manola and E. Miller, “RDF Primer, ” W3C Working Draft, 23 January 2003
[18]Beckwith R. 1998 “Design and Implementation of the WordNet Lexical Database and Searching Software, ” in Fellbaum C. (ed) 1999 WordNet: An Electronic Lexical Database, The MIT Press, pp105-127.
[19]Boris Katz Jimmy Lin, “Annotating the Semantic Web Using Natural Language, ” In Proceedings of the 2nd Workshop on NLP and XML (NLPXML 2002) at COLING 2002, September 2002, Taipei, Taiwan.
[20]Echa Chang, Chu-Ren Huang, Sue-Jin Ker, Chang-Hua Yang, “Induction of Classification from Lexicon Expansion: Assigning Domain Tags to WordNet Entries,” In Proceedings of SemaNet'02: Building and Using Semantic Networks. A COLING2002 post-conference workshop. August 30, 2002.
[21]Christiane Fellbaum. WordNet : An Electronic Lexical Database. The MIT Press. Cambridge, Massachusetts, 1998.
[22]黃居仁, 2003. 語言的網路,知識的架構:由意義誘發的語言科技. 第三屆「語言與科技」研討會邀請講席。 2003年12月20日,台灣師範大學。
[23]黃居仁。 2002.。語意網,詞網,與知識本體:淺談未來網絡上的知識運籌. 佛教知識組織管理研討會. 專題演講。2002年9月13日
[24]Huang, Chu-Ren, I-Ju E. Tseng, Dylan B.S. Tsai. 2002. “ Translating Lexical Semantic Relations: The first step towards Multilingual Wordnets. ”  In Proceedings of SemaNet'02: Building and Using Semantic Networks. A COLING2002 post-conference workshop. August 30, 2002.
[25]George A. Miller, “WordNet: A Lexical Database,” Comm. ACM, Vol. 38, No. 11, 1993, pp. 39-41.
論文全文使用權限
校內
校內紙本論文立即公開
同意電子論文全文授權校園內公開
校內電子論文立即公開
校外
同意授權
校外電子論文立即公開

如有問題,歡迎洽詢!
圖書館數位資訊組 (02)2621-5656 轉 2487 或 來信