淡江大學覺生紀念圖書館 (TKU Library)
進階搜尋


下載電子全文限經由淡江IP使用) 
系統識別號 U0002-3107201711462500
中文論文名稱 數值型項目之循序樣式的變化研究-以降雨資料為例
英文論文名稱 A Study of Change Detection for Sequential Patterns of Numerical Items - Using Rainfall Data as an Example
校院名稱 淡江大學
系所名稱(中) 資訊管理學系碩士班
系所名稱(英) Department of Information Management
學年度 105
學期 2
出版年 106
研究生中文姓名 張詮舜
研究生英文姓名 Chuan-Shun Chang
學號 603630335
學位類別 碩士
語文別 中文
口試日期 2017-06-04
論文頁數 58頁
口試委員 指導教授-周清江
委員-張昭憲
委員-趙景明
中文關鍵字 循序樣式  樣式改變  資料探勘  頻繁樣式 
英文關鍵字 Sequential pattern  Change detection  Data mining  Frequent pattern 
學科別分類
中文摘要 循序樣式探勘是從序列資料庫中,找出頻繁出現且有順序的樣式,通常這些樣式會再被轉換成先前所不知道的、有用的與有價值的資訊。過去相關研究大部分著重於演算法的效能以及為了蒐集到樣式的可用性而設定相關限制,如時間、效益等。以時間這個相關限制來看,過去研究較少考慮到在不同時間背景下,樣式會改變,使過去蒐集到的樣式之參考性下降。因此,本研究參考過去研究在循序樣式變化相關研究架構,提出一個能找出不同時段之循序樣式變化的方法,針對以強度分級的項目,把項目的強度差距納入考量,並改進在計算樣式差異度時因不符合三角不等式的原理造成的差異度不一致性。針對樣式變化分類,我們也提出一個新的分類方式,避免了過去研究重複分類的情形,最後,我們將此方法應用於中央氣象局的公開降雨資料,找出不同年間的降雨樣式的變化。
英文摘要 Sequential pattern mining is to extract frequent sequentially ordered patterns, which are usually transformed into previously unknown, meaningful, and useful information. Most of past frequent pattern mining researches focused on the effectiveness of algorithms. To increase the utilization of these patterns, they set constraints on time, benefits, and so on. In the aspect of timing, most past studies did not consider change of patterns in different periods. That caused the decline of utilization reference in the collected patterns. Therefore, based on previous researches on change detection of sequential patterns, for items representing different degrees of intensity, we propose a framework to extract change of their sequential patterns in different periods. We consider the intensity difference of the items, and remedy the inconsistency problem, caused by failing to conform the triangular inequality, of previous researches. As for pattern change classification, we propose a new classification method to avoid duplicate classification phenomena in previous researches. Finally, we apply this framework to the public rainfall data provided by Central Meteorological Bureau, to identify changes in the rainfall patterns over the years.
論文目次 目錄
第一章 緒論 1
1.1 研究背景與動機 1
1.2 研究目的 3
第二章 文獻探討 4
2.1 循序樣式探勘 4
2.2 有條件限制的循序樣式探勘 5
2.3 循序樣式變化 7
2.4 降雨預測 10
第三章 數值型項目之循序樣式變化檢測框架 12
3.1 Tsai 與 Shieh 的成果簡介 12
3.1.1產生頻繁循序樣式 13
3.1.2樣式差異度比較 14
3.1.3樣式變化分類 16
3.1.4 Tsai 與 Shieh 的成果總結 18
3.2 頻繁循序樣式探勘 19
3.3 樣式差異度比較 21
3.4 樣式變化分類 28
第四章 實驗 31
4.1 資料來源 31
4.2 產生頻繁循序樣式集 32
4.3 實驗一 33
4.4 實驗二 37
4.4.1案例一 37
4.4.2案例二 41
4.4.3案例三 43
4.4.4案例四 45
4.4.5案例綜合結論 47
4.5 實驗三 49
4.6 長期樣式變化分類結果 52
第五章 結論 55
參考文獻 57

表目錄
表1:Tsai & Shieh[15]所定義的樣式變化分類準則 17
表2:降雨事件等級 22
表3:字串writer跟author的編輯距離比較 25
表4:展示樣式差異度之範例樣式 27
表5:樣式之編輯距離矩陣範例 27
表6:範例樣式組之DV及各樣式之MD 27
表7:高雄觀測站2007年6月至8月頻繁循序樣式數量 33
表8:高雄觀測站2012年6月至8月頻繁循序樣式數量 33
表9:2007、2012年β=0.125時各下的樣式變化分類數量 34
表10:高雄觀測站2007年及2012年Emerging patterns結果 39
表11:高雄觀測站2007年及2012年的Unexpected change patterns結果 40
表12:高雄觀測站2007年及2012年的Perished patterns結果 40
表13:高雄觀測站2007年及2012年的Added patterns結果 40
表14:玉山觀測站2008年及2009年的Emerging patterns結果 42
表15:玉山觀測站2008年及2009年的Unexpected change patterns結果 42
表17:玉山觀測站2008年及2009年的Added patterns結果 42
表18:花蓮觀測站2010年及2011年的Emerging patterns結果 44
表19:花蓮觀測站2010年及2011年的Unexpected change patterns結果 44
表21:花蓮觀測站2010年及2011年的Added patterns結果 45
表22:板橋觀測站2012年及2013年的Emerging patterns結果 46
表23:板橋觀測站2012年及2013年的Unexpected change patterns結果 46
表24:花蓮觀測站2012年及2013年的Perished patterns結果 47
表25:花蓮觀測站2012年及2013年的Added patterns結果 47
表26:高雄觀測站2011年及2012年視窗長度為8天的樣式變化探勘結果 50
表27:高雄觀測站2011年及2012年視窗長度為14天的樣式變化探勘結果 50
表28:高雄觀測站連續9年6月至8月之來源序列總數及樣式數量 53

圖目錄
圖1:Tsai & Shieh[15]所定義的樣式變化分類標準概念圖 17
圖2:移動單位為8天時的移動視窗概念圖 20
圖3:樣式分類概念圖 29
圖4:2007年高雄觀測站蒐集之降雨事件分佈 32
圖5:β值及值對Unexpected change patterns的數量影響 35
圖6:β值及值對Perished patterns的數量影響 36
圖7:β值及值對Added patterns的數量影響 36
圖8:高雄觀測站2007年及2012年6至8月日累積雨量比較圖 49
圖9:高雄觀測站連續9年6月至8月之Emerging patterns數量 53
圖10:高雄觀測站連續9年6月至8月之Unexpected change patterns數量 54
圖11:高雄觀測站連續9年6月至8月之Perished patterns數量 54
圖12:高雄觀測站連續9年6月至8月之Added patterns數量 54

參考文獻 [1]黃正魁、楊溥泰、鄧任宏,”變化探勘模型:以序列式因果樣式為例”,2016第二十七屆國際資訊管理學術研討會。
[2]黃椿喜、葉世瑄、陳新淦、楊攸祁、呂國臣、洪景山,”中央氣象局定量降水預報之發展與挑戰”,2015年天氣分析與預報研討會。
[3]葉天降、黃椿喜、謝明昌、洪景山,”中央氣象局雨量大數據,雨量觀測、估計及定量降水預報”,2015年天氣分析與預報研討會。
[4]Agrawal, R., and Srikant, R. 1995. "Mining Sequential Patterns", Proceedings of the 11th International Conference on Data Engineering, pp3-14.
[5]Carsten, L., and lngrid R. 1999. “Adaptive Information Filtering:Detecting Changes in Text Streams”, Proceedings of the 1999 ACM CIKM International Conference on Information and Knowledge Management, pp538-544.
[6]Chen, K-Y., Jaysawa, B.P., Huang, J-W., and Wu, Y-B. 2014. "Mining Frequent Time Interval-based Event with Duration Patterns from Temporal Database", Proceedings of International Conference on Data Science and Advanced Analytics (DSAA), pp548-554.
[7]Chen, Y-C., Jiang, J-C., Peng, W-C., and Lee, S-Y. 2014. "An Efficient Algorithm for Mining Time Interval-based Patterns in Large Databases", Proceedings of 19th ACM International Conference on Information and Knowledge Management, pp49-58.
[8]Chen, Y-C., Peng, W-C., and Lee, S-Y. 2015. "Mining Temporal Patterns in Time Interval-Based Data", IEEE Transactions on Knowledge and Data Engineering (27:12), pp3318-3331.
[9]Deng, K., and Zaïane, O.R. 2010. "An Occurrence Based Approach to Mine Emerging Sequences", Proceedings of International Conference on Data Warehousing and Knowledge Discovery, pp275-284.
[10]Dong, G., and Li, J. 1999. "Efficient Mining of Emerging Patterns: Discovering Trends and Differences", Proceedings of the 5th ACM SIGKDD international conference on Knowledge discovery and data mining, pp43-52.
[11]Lin, J.C-W., Gan, W., Philippe, F-V., and Hong, T-P. 2015. "Mining High-Utility Itemsets with Multiple Minimum Utility Thresholds", Proceedings of the 8th International C* Conference on Computer Science & Software Engineering, pp9-17.
[12]Pei, J., Han, J., Behzad, M-A., and Pinto, H. 2001. "PrefixSpan: Mining Sequential Patterns Efficiently by Prefix-Projected Pattern Growth", Proceedings of the 17th International Conference on Data Engineering (2:6), pp215-224.
[13]Song, H.S., Kim, J.K., and Kim, S.H. 2001. “Mining the change of customer behavior in an internet shopping mall”, Expert Systems with Applications (21:3), pp157-168.
[14]Suzuki, E. 1999. “Autonomous Discovery of Reliable Exception Rules”, Proceedings of 19th ACM International Conference on Discovery Science,pp184-195.
[15]Tsai, C-Y., and Shieh, Y-C. 2009. "A Change Detection Method for Sequential Patterns", Decision Support Systems (46:2), pp501-511.

論文使用權限
  • 同意紙本無償授權給館內讀者為學術之目的重製使用,於2017-08-02公開。
  • 同意授權瀏覽/列印電子全文服務,於2017-08-02起公開。


  • 若您有任何疑問,請與我們聯絡!
    圖書館: 請來電 (02)2621-5656 轉 2486 或 來信