淡江大學覺生紀念圖書館 (TKU Library)
進階搜尋


下載電子全文限經由淡江IP使用) 
系統識別號 U0002-3007200703112700
中文論文名稱 建置語意問答系統之知識本體
英文論文名稱 Semantic-aware Ontology for QA System
校院名稱 淡江大學
系所名稱(中) 資訊工程學系碩士班
系所名稱(英) Department of Computer Science and Information Engineering
學年度 95
學期 2
出版年 96
研究生中文姓名 顏義祥
研究生英文姓名 Yi-Hsiang Yan
電子信箱 692192239@s92.tku.edu.tw
學號 692192239
學位類別 碩士
語文別 中文
口試日期 2007-06-05
論文頁數 70頁
口試委員 指導教授-葛煥昭
委員-陳朝欽
委員-廖弘源
委員-葛煥昭
委員-王英宏
中文關鍵字 知識本體  遠距學習 
英文關鍵字 Ontology  Distance Learning 
學科別分類 學科別應用科學資訊工程
中文摘要 本論文提出一個具備語意感知能力的知識本體詞彙庫建構方法,提供語意問答系統在語意流程上的支援,以滿足數位教學環境的需求。透過線上百科做為後端資料,除了建立出同義詞網路,並提出計算語意相似度的方法隔離專有領域的範圍,自動化的流程大幅減少建置知識本體所需的人力成本。
本論文專注在知識本體建置上關係最密切的詞彙資訊,藉由實作來檢驗語意方法的可行性,進而建構出一個領域相關的詞彙網路,這個詞彙網路除了可以做為在語意問答系統中的WordNet替代方案之外,也可作為未來設計更有彈性的知識架構的參考模型。
英文摘要 In this thesis, we proposed an automated ontological creation process, and focus on domain terminology’s relationship. By analyzing web pages on Wikipedia, an online encyclopedia, we constructed not only a dictionary but a semantically related words’ network.
In order to fulfill the semantics’ need, we also proposed an algorithm to calculate the semantic distance between terms. The entire process can greatly reduce the human resource requirement in building a traditional domain Ontology.
This system also provides a better support for domain-specific QA systems than a general purpose lexical dictionary in its flexibility and further offloads the semantic process burdened on QA systems.
論文目次 目次 I
表次 III
圖次 IV
第一章 緒論 1
1.1 前言 1
1.2 研究背景 1
1.2.1 語意問答系統概觀 2
1.2.2 句法分析階段 4
1.2.3 語意分析階段 4
1.2.4 知識本體過程 5
1.2.5 系統回饋 8
1.3 研究動機與目的 9
1.4 論文架構 10
第二章 相關研究與知識 11
2.1 知識本體與知識架構 11
2.2 WIKIPEDIA線上百科全書 14
2.3 WEB CONTENT RETRIEVAL 16
2.4 HTML PARSER 19
第三章 系統流程與方法設計 21
3.1 排程器設計 22
3.1.1 網頁分析 23
3.1.2 節點過濾器設計 27
3.1.3 排程器走訪演算法 29
3.1.4 網頁及連結紀錄檔 31
3.2 建立同義詞集合 33
3.3 計算語意相似度 35
第四章 方法實作與評量 52
4.1 網頁走訪 52
4.2 建立同義詞集合 54
4.3 計算語意相似度 56
第五章 結論與未來研究方向 60
5.1 結論 60
5.2 未來研究方向 61
參考文獻 62
附錄—英文論文 64
表次
表 1 以Java 提供的類別擷取網頁文件 ......................................... 17
表 2 以HTMLParser 擷取HTML 文件內資訊 ............................. 19
表 3 連結節點過濾器程式片段 ...................................................... 28
表 4 標題節點過濾器程式片段 ...................................................... 29
表 5 排程器走訪演算法 .................................................................. 30
表 6 建立同義詞集合演算法 .......................................................... 33
表 7 計算語意相似度演算法 .......................................................... 50
表 8 向上回報的演算法 .................................................................. 51
表 9 資料結構領域字彙 (部份) ................................................ 58
圖次
圖 1 語意問答系統 .............................................................................. 3
圖 2 Link Grammar 語法剖析器 ......................................................... 4
圖 3 『資料結構』課程在知識本體中的概念層 .............................. 5
圖 4 『資料結構』課程在知識本體中的實例層 .............................. 6
圖 5 Wikipedia 線上百科全書 – Data structure ................................ 15
圖 6 系統流程圖 ................................................................................ 21
圖 7 Wikipedia 網頁配置圖 ................................................................ 23
圖 8 在Wikipedia 上詞彙的連結關係示意圖 ................................... 26
圖 9 頁面連結紀錄檔(部份) ........................................................ 31
圖 10 網頁走訪紀錄檔(部份) ...................................................... 32
圖 11 導致深度優先的演算法 .......................................................... 32
圖 12 同義詞網路示意圖 .................................................................. 34
圖 13 計算語意相似度過程 (1/14) ................................................... 36
圖 14 計算語意相似度過程 (2/14) ................................................... 37
圖 15 計算語意相似度過程 (3/14) ................................................... 38
圖 16 計算語意相似度過程 (4/14) ................................................... 39
圖 17 計算語意相似度過程 (5/14) ................................................... 40
圖 18 計算語意相似度過程 (6/14) ................................................... 41
圖 19 計算語意相似度過程 (7/14) ................................................... 42
圖 20 計算語意相似度過程 (8/14) ................................................... 43
圖 21 計算語意相似度過程 (9/14) ................................................... 44
圖 22 計算語意相似度過程 (10/14) ................................................. 45
圖 23 計算語意相似度過程 (11/14) .................................................. 46
圖 24 計算語意相似度過程 (12/14) ................................................. 47
圖 25 計算語意相似度過程 (13/14) ................................................. 48
圖 26 計算語意相似度過程 (14/14) ................................................. 49
圖 27 頁面連結涵蓋總頁面數 .......................................................... 52
圖 28 詞條重覆定義 .......................................................................... 54
圖 29 同義詞集合 (部份) ............................................................ 55
圖 30 語意距離斷層 .......................................................................... 56
參考文獻 [1] 黃世豪, 語意問答系統應用程式架構(Application Architecture of Semantic QA System), 2006年, 淡江大學碩士論文
[2] 黃朱麒, 在遠距學習環境下以Link Grammar為基礎的語意認知方法(A Link Grammar-Based Semantic-Aware Methodology for Distance Learning), 2006年, 淡江大學碩士論文
[3] Daniel Sleator, David Temperley, and John Lafferty, “Link Grammar,”
[4] George Miller, “WordNet, a lexical database for the English language,”
[5] World Wide Web Consortium(W3C),
[6] Michael K. Smith, Chris Welty, and Deborah L. McGuinness, Editors, “OWL Web Ontology Language Guide,” W3C Recommendation, 10 February 2004, Latest version available at
[7] Graham Klyne and Jeremy J. Carroll, Editors, “Resource Description Framework (RDF): Concepts and Abstract Syntax,” W3C Recommendation, 10 February 2004, Latest version available at
[8] Extensible Markup Language(XML),
[9] Ward Cunningham, “The Wiki way: quick collaboration on the Web,” Year of Publication: 2001 ISBN 0-201-71499-X
[10] HTML Parser,

論文使用權限
  • 同意紙本無償授權給館內讀者為學術之目的重製使用,於2007-08-01公開。
  • 同意授權瀏覽/列印電子全文服務,於2007-08-01起公開。


  • 若您有任何疑問,請與我們聯絡!
    圖書館: 請來電 (02)2621-5656 轉 2281 或 來信