淡江大學覺生紀念圖書館 (TKU Library)
進階搜尋


下載電子全文限經由淡江IP使用) 
系統識別號 U0002-0602200716363200
中文論文名稱 設計輔助英語學習之網頁推薦系統
英文論文名稱 The Designing of a Web Page Recommendation System for ESL
校院名稱 淡江大學
系所名稱(中) 資訊工程學系碩士班
系所名稱(英) Department of Computer Science and Information Engineering
學年度 95
學期 1
出版年 96
研究生中文姓名 彭家俊
研究生英文姓名 Chia-Chun Peng
電子信箱 bill.peng@gmail.com
學號 693191420
學位類別 碩士
語文別 中文
口試日期 2007-01-04
論文頁數 69頁
口試委員 指導教授-郭經華
委員-陳孟彰
委員-王英宏
中文關鍵字 相關網頁推薦  以英文為第二外語  中繼搜尋  文章摘要 
英文關鍵字 Web Page Recommendation System  English as a Second Language  Meta Search API  Article Summary 
學科別分類 學科別應用科學資訊工程
中文摘要 在本論文中,提出利用中繼搜尋的概念,結合文章摘要技術,試圖協助第二語言使用者決定關鍵字,並減少反覆的檢索的過程,提升使用者的閱讀及學習效率。對於系統而言,利用中繼搜尋做初步的過濾以降低後端儲存以及計算的時間。
在網頁蒐集部份,不同於一般搜尋引擎蒐集方式,我們只蒐集學習者曾經瀏覽過網頁與其延伸的相關網頁,節省了網路資源及儲存空間的花費。在搜尋相關網頁部份,當學習者想要找出目前閱讀文章的相關網頁時,為了避免在對語言還不熟悉的情況下,輸入不適當的關鍵字,浪費許多找尋相關網頁的時間,所以我們設計了不需輸入任何關鍵字,就能自動找出這篇文章相關網頁的方法,讓使用者很快的找到更多相似文章來閱讀。
在呈現上,以toolbar 作為與使用者溝通的方式。讓使用者只要在瀏覽器上安裝toolbar,就可以得到我們所提供的系統協助,相關網頁、難易度等資訊來幫助英語學習,以期打造一個更友善的英語學習環境。
英文摘要 In this proposal, a webpage recommendation system is constructed through the concept of Meta Search and article summary technique. The system recommends webpages that are related to the current webpage, to provide the user with further reading material. Using article-searching mechanism, the ESL student can avoid using a keyword search method, thereby greatly decreasing the time spent to look for related articles. This in turn increases learning efficiency. A toolbar is the main medium of communication with the user. All the user has to do is install the toolbar on the browser to gain the assistance from the system. The system provides related articles as well as information such as the difficulty of the articles, which would assist English learning, and harbor a more user friendly English learning environment.
論文目次 第1章 緒論 1
1.1 研究動機與目的 1
1.2 研究內容 3
1.3 論文內容大綱 4
第2章 背景知識與相關研究 5
2.1 搜尋引擎系統與關鍵字 6
2.2 網頁蒐集與中繼搜尋 9
2.3 文章摘要 (TEXT SUMMARIZATION) 13
2.4 群聚度(CLUSTERING COEFFICIENT) 18
2.5 以內容為基礎之相似網頁搜尋技術 20
2.6 英國國家標準語料庫 24
第3章 系統架構 28
3.1 網路文章蒐集子系統 30
3.1.1 目標網頁前處理(Target page preprocess) 31
3.1.2 產生關鍵字(Keyword Generation) 35
3.1.3 Meta Search API & Related Page preprocess 37
3.2 相關網頁資料庫 39
3.3 文章評分推薦子系統 40
3.3.1 可讀性檢驗(Reading ability checking) 41
3.3.2 推薦順序與即時相似度調整機制 42
第4章 實作與討論 44
4.1 實作介面 44
4.2 文章推薦系統的效能評估 47
第5章 結論與未來研究 50
5.1 結論 50
5.2 未來研究方向 50
參考文獻: 52
附錄 55

圖目錄
圖1.1-1 一般使用情境圖 2
圖2.3-1 社交網路範例 14
圖2.4-1 群聚度範例圖 19
圖2.5-1 The cosine of Ө is adopted as 21
圖 3.0-1 系統架構圖 28
圖3.1-1 文章蒐集子系流程圖 30
圖 3.1-2 前處理簡易流程圖 32
圖4.1-1 Toolbar 介面圖 44
圖4.1-2 我的搜尋清單 45
圖4.1-3 推薦介面圖 46
圖4.2-1 群聚度與文章摘要關係圖 47
圖4.2-2 實驗精確度評估圖 49

表目錄
表 2.2-1 google搜尋功能一覽表 11
表2.6-1 BNC語料內容分類表 26
表2.6-2 BNC語料與年齡關係表 26
表2.6-3 BNC語料與年齡關係表 27
表2.6-4 BNC語料與性別關係表 27
表 3.1-1 目標網頁資料表 39
表 3.1-2 相關網頁資料表 39
表4.2-1 實驗數據表 47



參考文獻 [1] Google. http://www.google.com
[2] Yahoo. http://www.yahoo.com
[3] A. Gulli and A. Signorini “Building an Open Source Meta-Search Engine” WWW 2005
[4] Junjie Chen and Wei Liu “A Framework for Intelligent Meta-search Engine Based on Agent”, ICITA 2005
[5] Soumen Chakrabarti and Martin van den Berg and Byron Dom “Focused crawling: a new approach to topic-specific Web resource discovery” In Proc. of WWW Conf., 1999.
[6] Charu C. Aggarwal and Fatima Al-Garawi and Philip S. Yu “Intelligent Crawling on the World Wide Web with Arbitrary Predicates” WWW Conf., 2001
[7] Google SOAP Search API. http://code.google.com/apis/soapsearch/
[8] Yihong Gong and Xin Liu “Generic Text Summarization Using Relevance Measure and Latent Semantic Analysis” SIGIR 2001
[9] G¨une¸s Erkan and Dragomir R. Radev “LexRank: Graph-based Centrality as Salience in Text Summarization” 2004 AI Access Foundation.
[10] Perron-Frobenius theorem (Seneta, 1981)
[11] Page, L., Brin, S., Motwani, R., & Winograd, T. (1998). “The pagerank citation ranking: Bringing order to the web”. Technical report, Stanford University, Stanford, CA
[12] Duncan J. Watts & Steven H. Strogatz Collective dynamics of ‘small-world’ networks NATURE | VOL 393 | 4 JUNE 1998
[13] G. Salton and M. J. McGill,“Introduction to Modern Information Retrieval”, McGraw-Hill Book Co., New York, 1983.
[14] R. Baeza-Yates and B. Ribeiro-Neto,“Moderm Information Retrieval”, Addison Wesley Longman, Inc, May 1999.
[15] Zhang, T., Ramakrishnan, R., And Livny, M. 1996. Birch: “An efficient data clustering method for very large databases.” Sigmod Rec. 25, 2, 103–114.
[16] BNC - British National Corpus.
[17] DOM: Document Object Model http://www.w3.org/DOM/
[18] Suhit Gupta & Gail Kaiser & David Neistadt & Peter Grimm “DOM-bassed Content Extraction of HTML” Documents WWW 2003
[19] Lan Yi & Bing Liu & Xiaoli Li “Eliminating Noisy Information in Web Pages for Data Ming” SIGKDD 2003
[20] Kevyn Collins-Thompson & Jamie Callan “A Language Modeling Approach to Predicting Reading Difficulty
論文使用權限
  • 同意紙本無償授權給館內讀者為學術之目的重製使用,於2007-02-08公開。
  • 同意授權瀏覽/列印電子全文服務,於2007-02-08起公開。


  • 若您有任何疑問,請與我們聯絡!
    圖書館: 請來電 (02)2621-5656 轉 2281 或 來信