§ 瀏覽學位論文書目資料
  
系統識別號 U0002-3007200703112700
DOI 10.6846/TKU.2007.01007
論文名稱(中文) 建置語意問答系統之知識本體
論文名稱(英文) Semantic-aware Ontology for QA System
第三語言論文名稱
校院名稱 淡江大學
系所名稱(中文) 資訊工程學系碩士班
系所名稱(英文) Department of Computer Science and Information Engineering
外國學位學校名稱
外國學位學院名稱
外國學位研究所名稱
學年度 95
學期 2
出版年 96
研究生(中文) 顏義祥
研究生(英文) Yi-Hsiang Yan
學號 692192239
學位類別 碩士
語言別 繁體中文
第二語言別
口試日期 2007-06-05
論文頁數 70頁
口試委員 指導教授 - 葛煥昭
委員 - 陳朝欽
委員 - 廖弘源
委員 - 葛煥昭
委員 - 王英宏
關鍵字(中) 知識本體
遠距學習
關鍵字(英) Ontology
Distance Learning
第三語言關鍵字
學科別分類
中文摘要
本論文提出一個具備語意感知能力的知識本體詞彙庫建構方法,提供語意問答系統在語意流程上的支援,以滿足數位教學環境的需求。透過線上百科做為後端資料,除了建立出同義詞網路,並提出計算語意相似度的方法隔離專有領域的範圍,自動化的流程大幅減少建置知識本體所需的人力成本。
本論文專注在知識本體建置上關係最密切的詞彙資訊,藉由實作來檢驗語意方法的可行性,進而建構出一個領域相關的詞彙網路,這個詞彙網路除了可以做為在語意問答系統中的WordNet替代方案之外,也可作為未來設計更有彈性的知識架構的參考模型。
英文摘要
In this thesis, we proposed an automated ontological creation process, and focus on domain terminology’s relationship. By analyzing web pages on Wikipedia, an online encyclopedia, we constructed not only a dictionary but a semantically related words’ network. 
In order to fulfill the semantics’ need, we also proposed an algorithm to calculate the semantic distance between terms. The entire process can greatly reduce the human resource requirement in building a traditional domain Ontology. 
This system also provides a better support for domain-specific QA systems than a general purpose lexical dictionary in its flexibility and further offloads the semantic process burdened on QA systems.
第三語言摘要
論文目次
目次	I
表次	III
圖次	IV
第一章	緒論	1
1.1	前言	1
1.2	研究背景	1
1.2.1	語意問答系統概觀	2
1.2.2	句法分析階段	4
1.2.3	語意分析階段	4
1.2.4	知識本體過程	5
1.2.5	系統回饋	8
1.3	研究動機與目的	9
1.4	論文架構	10
第二章	相關研究與知識	11
2.1	知識本體與知識架構	11
2.2	WIKIPEDIA線上百科全書	14
2.3	WEB CONTENT RETRIEVAL	16
2.4	HTML PARSER	19
第三章	系統流程與方法設計	21
3.1	排程器設計	22
3.1.1	網頁分析	23
3.1.2	節點過濾器設計	27
3.1.3	排程器走訪演算法	29
3.1.4	網頁及連結紀錄檔	31
3.2	建立同義詞集合	33
3.3	計算語意相似度	35
第四章	方法實作與評量	52
4.1	網頁走訪	52
4.2	建立同義詞集合	54
4.3	計算語意相似度	56
第五章	結論與未來研究方向	60
5.1	結論	60
5.2	未來研究方向	61
參考文獻	62
附錄—英文論文	64
表次
表 1 以Java 提供的類別擷取網頁文件 ......................................... 17
表 2 以HTMLParser 擷取HTML 文件內資訊 ............................. 19
表 3 連結節點過濾器程式片段 ...................................................... 28
表 4 標題節點過濾器程式片段 ...................................................... 29
表 5 排程器走訪演算法 .................................................................. 30
表 6 建立同義詞集合演算法 .......................................................... 33
表 7 計算語意相似度演算法 .......................................................... 50
表 8 向上回報的演算法 .................................................................. 51
表 9 資料結構領域字彙 (部份) ................................................ 58
圖次
圖 1 語意問答系統 .............................................................................. 3
圖 2 Link Grammar 語法剖析器 ......................................................... 4
圖 3 『資料結構』課程在知識本體中的概念層 .............................. 5
圖 4 『資料結構』課程在知識本體中的實例層 .............................. 6
圖 5 Wikipedia 線上百科全書 – Data structure ................................ 15
圖 6 系統流程圖 ................................................................................ 21
圖 7 Wikipedia 網頁配置圖 ................................................................ 23
圖 8 在Wikipedia 上詞彙的連結關係示意圖 ................................... 26
圖 9 頁面連結紀錄檔(部份) ........................................................ 31
圖 10 網頁走訪紀錄檔(部份) ...................................................... 32
圖 11 導致深度優先的演算法 .......................................................... 32
圖 12 同義詞網路示意圖 .................................................................. 34
圖 13 計算語意相似度過程 (1/14) ................................................... 36
圖 14 計算語意相似度過程 (2/14) ................................................... 37
圖 15 計算語意相似度過程 (3/14) ................................................... 38
圖 16 計算語意相似度過程 (4/14) ................................................... 39
圖 17 計算語意相似度過程 (5/14) ................................................... 40
圖 18 計算語意相似度過程 (6/14) ................................................... 41
圖 19 計算語意相似度過程 (7/14) ................................................... 42
圖 20 計算語意相似度過程 (8/14) ................................................... 43
圖 21 計算語意相似度過程 (9/14) ................................................... 44
圖 22 計算語意相似度過程 (10/14) ................................................. 45
圖 23 計算語意相似度過程 (11/14) .................................................. 46
圖 24 計算語意相似度過程 (12/14) ................................................. 47
圖 25 計算語意相似度過程 (13/14) ................................................. 48
圖 26 計算語意相似度過程 (14/14) ................................................. 49
圖 27 頁面連結涵蓋總頁面數 .......................................................... 52
圖 28 詞條重覆定義 .......................................................................... 54
圖 29 同義詞集合 (部份) ............................................................ 55
圖 30 語意距離斷層 .......................................................................... 56
參考文獻
[1] 黃世豪, 語意問答系統應用程式架構(Application Architecture of Semantic QA System), 2006年, 淡江大學碩士論文
[2] 黃朱麒, 在遠距學習環境下以Link Grammar為基礎的語意認知方法(A Link Grammar-Based Semantic-Aware Methodology for Distance Learning), 2006年, 淡江大學碩士論文
[3] Daniel Sleator, David Temperley, and John Lafferty, “Link Grammar,” <http://www.link.cs.cmu.edu/link/>
[4] George Miller, “WordNet, a lexical database for the English language,” <http://www.cogsci.princeton.edu/~wn/>
[5] World Wide Web Consortium(W3C), <http://www.w3.org/>
[6] Michael K. Smith, Chris Welty, and Deborah L. McGuinness, Editors, “OWL Web Ontology Language Guide,” W3C Recommendation, 10 February 2004, <http://www.w3.org/TR/2004/REC-owl-guide-20040210/> Latest version available at <http://www.w3.org/TR/owl-guide/> 
[7] Graham Klyne and Jeremy J. Carroll, Editors, “Resource Description Framework (RDF): Concepts and Abstract Syntax,” W3C Recommendation, 10 February 2004, <http://www.w3.org/TR/2004/REC-rdf-concepts-20040210/> Latest version available at <http://www.w3.org/TR/rdf-concepts/> 
[8] Extensible Markup Language(XML), <http://www.w3.org/XML>
[9] Ward Cunningham, “The Wiki way: quick collaboration on the Web,” Year of Publication: 2001 ISBN 0-201-71499-X
[10] HTML Parser, <http://http://htmlparser.sourceforge.net/>
論文全文使用權限
校內
校內紙本論文立即公開
同意電子論文全文授權校園內公開
校內電子論文立即公開
校外
同意授權
校外電子論文立即公開

如有問題,歡迎洽詢!
圖書館數位資訊組 (02)2621-5656 轉 2487 或 來信