系統識別號 | U0002-3006200717474700 |
---|---|
DOI | 10.6846/TKU.2007.01002 |
論文名稱(中文) | 中文論文審查者推薦方法之研究 |
論文名稱(英文) | Research on Recommendation of Chinese Paper Reviewers |
第三語言論文名稱 | |
校院名稱 | 淡江大學 |
系所名稱(中文) | 資訊管理學系碩士班 |
系所名稱(英文) | Department of Information Management |
外國學位學校名稱 | |
外國學位學院名稱 | |
外國學位研究所名稱 | |
學年度 | 95 |
學期 | 2 |
出版年 | 96 |
研究生(中文) | 羅欣瑜 |
研究生(英文) | Hsin-Yu Lo |
學號 | 694520296 |
學位類別 | 碩士 |
語言別 | 繁體中文 |
第二語言別 | |
口試日期 | 2007-06-09 |
論文頁數 | 38頁 |
口試委員 |
指導教授
-
魏世杰
委員 - 呂芳懌 委員 - 翁頌順 |
關鍵字(中) |
向量空間模式 文章表現法 自動推薦 論文審查者 OpenConf推薦模式 |
關鍵字(英) |
Vector Space Model Document Representation Automatic Recommendation Paper Reviewer OpenConf Recommendation Model |
第三語言關鍵字 | |
學科別分類 | |
中文摘要 |
隨著傳統期刊逐漸轉變為電子期刊出版模式,除了期刊編輯出版電子化之外,也帶動「線上投稿暨審查系統」之潮流。以OpenConf線上投稿暨審查系統為例,本研究探討其自動推薦論文審查者功能,發現其自動推薦是依據審稿者及投稿文章作者自行勾選的主題群做推薦,侷限於期刊本身自訂的主題範圍。為了打破此侷限,本文方法均以自動粹取關鍵詞來進行,並嘗試用4種不同文章表現法,搭配7種評分方法,包括向量空間模式下的4種相似度計算方法,及OpenConf系統中的3種自動推薦審查者功能,交叉組合出4x7=28個實驗。結果顯示,以向量空間模式的餘弦相似度計算,搭配以摘要文為章表現法的推薦方法,其推薦效果為最好。 |
英文摘要 |
As more e-journals appear and the e-review process becomes more popular, the demand for automatic recommendation of a good peer reviewer has been ever increasing. With its free and open source policy, OpenConf stands out as a popular system for automatic recommendation of reviewers and serves as a good benchmark for comparison of similar systems. After analysis of its source code, we found that OpenConf represents each reviewer or paper by a set of manually selected topics which are predefined. It also provides three ad hoc scoring methods for matching reviewers and papers. To automate the paper representation, this work evaluates 4 kinds of paper representation which include full text, abstract, title, and author defined keywords. To match reviewers and papers, this work evaluates 7 kinds of scoring methods which include 3 ad hoc methods from OpenConf and 4 variant methods from the traditional vector space model. The result of the 4x7=28 experiments shows that recommendation methods based on the vector space model are better than the 3 ad hoc methods of OpenConf in most document representations. Among them, the paper representation by the abstract combined with the matching by the cosine measure has the highest average precision. |
第三語言摘要 | |
論文目次 |
目錄 第一章 緒論 1 1.1 研究背景 1 1.2 研究動機 3 1.3 研究目的 5 1.4 研究限制 6 第二章 相關研究與文獻探討 7 2.1 AutoTag 7 2.2 文章表現模式 7 2.2.1 布林模式 7 2.2.2向量空間模式及TFIDF權重法 8 2.3 相似度計算法 9 2.4 評估方法 11 2.5 OpenConf 13 2.5.1 簡介 13 2.5.2由低到高加權主題匹配法 14 2.5.3 由高到低加權主題匹配法 17 2.5.4 主題匹配法 17 第三章 研究方法 19 3.1 文章集及審查者專長之前處理 19 3.2 文章表現法 23 3.3 推薦審查者之評分方法 24 3.4 評估指標 25 3.5 實驗環境 26 3.6 實驗流程 27 第四章 實驗結果及統計分析 28 4.1 實驗結果 28 4.2 統計分析 32 第五章 結論與未來研究 35 第六章 參考文獻 37 圖目錄 圖一 : 蒐集專長項目 21 圖二 : 實驗流程圖 27 圖三: 4種文章表現法下以4種向量空間相似度算法所得16種推薦方法之平均精確率Avg_P100圖示 29 圖四 : 4種文章表現法下以OpenConf的3種獨特推薦分數算法所得12種推薦方法之平均精確率Avg_P100圖示 31 表目錄 表一 : 近年來歐美國家主要線上投稿暨評閱系統 2 表二 : 各系統自動推薦審查者功能之情形 3 表三 : 相似度計算公式 10 表四 : 系統推薦者及合適審查者人數對照表 12 表五 : 100篇文章資料集之統計資料 20 表六 : 審查者專長資料表片段 22 表七 : 194名審查者專長之統計資料 22 表八 : 推薦審查者之評分方法 24 表九 : 4種文章表現法下以4種向量空間相似度算法所得16種推薦方法之Avg_P100 28 表十 : 4種文章表現法下以OpenConf的3種獨特推薦分數算法所得12種推薦方法之Avg_P100 30 表十一: ANOVA變異數分析 32 表十二 : Avg_P100 =0.37推薦方法之α區間估計 32 表十三 : Avg_P100落於[0.32 ,0.43]區間的七種推薦方法 33 |
參考文獻 |
[1]中央研究院詞庫小組, AutoTag ,http://godel.iis.sinica.edu.tw/CKIP/ws/,2003。 [2]邱炯友,李怡萍,學術電子期刊編輯整合平台市場與個案:以教育資料與圖書館學季刊為例,教育資料與圖書館學,第 43 卷第 3 期.頁 327 – 345,2006。 [3]劉群,李素建,基於《知網》的辭彙語義相似度計算,中文計算語言學期刊,第 7 卷第 2 期, 頁 59-76,2002 [4]顏玉茵,台灣期刊電子化評閱系統之評析,南華大學碩士論文,頁19-24,2004。 [5]Aas, K. and Eikvil, L., “Text Categorisation: A Survey,” Technical Report, Norwegian Computing Center, June 1999. [6]Allan, J., Topic Detection and Tracking: Event-based Information Organization, Kluwer Academic Publishers, 2002. [7]Baeza-Yates, R. and Ribeiro-Neto, B., Modern Information Retrieval, Addsion Wesley Longman Limited, 1999. [8]Chakrabarti, S., Mining the Web: Discovering Knowledge from Hypertext Data, Morgan Kaufmann, 2003. [9]Kondrak, G., Marcu, D. and Knight, K., “Cognates Can Improve Statistical Translation Models,” Human Language Technology Conference of the North American Chapter of the Association for Computational Linguistics, pp. 46-48, 2003. [10]Salton, G. and Buckley, C., “Term-Weighting Approaches in Automatic Retrieval,” Information Processing and Management, vol. 24, no. 5, pp. 513-523, 1988. [11]Salton, G. and McGill, M. J., Introduction to Modern Information Retrieval, McGraw-Hill, 1989. [12]van Rijsbergen C. J., Information Retrieval, London: Butterworths , 1979. [13]Ware, M., Online Submission and Peer Review Systems, Learned Publishing, 2005. [14]Zakon Group, OpenConf, http://www.zakongroup.com/technology/openconf.shtml |
論文全文使用權限 |
如有問題,歡迎洽詢!
圖書館數位資訊組 (02)2621-5656 轉 2487 或 來信