§ 瀏覽學位論文書目資料
  
系統識別號 U0002-1607200703062400
DOI 10.6846/TKU.2007.00435
論文名稱(中文) 目標關聯式法則資料探勘演算法
論文名稱(英文) Goal Association Rule
第三語言論文名稱
校院名稱 淡江大學
系所名稱(中文) 資訊工程學系碩士在職專班
系所名稱(英文) Department of Computer Science and Information Engineering
外國學位學校名稱
外國學位學院名稱
外國學位研究所名稱
學年度 95
學期 2
出版年 96
研究生(中文) 張瑜紋
研究生(英文) Yu-Wen Chang
學號 793190116
學位類別 碩士
語言別 繁體中文
第二語言別
口試日期 2007-06-21
論文頁數 86頁
口試委員 指導教授 - 蔣定安
委員 - 葛煥昭
委員 - 王鄭慈
關鍵字(中) 關聯式法則
支持度
信賴度
資料探勘
概念層級
分類階層
關鍵字(英) Association Rule
Support
Confidence
Data Mining
Concept Level
Classification
第三語言關鍵字
學科別分類
中文摘要
傳統的關聯式法則,是對所有的交易進行分析,將所有交易隱含的關聯找出來,在沒有針對特定目標處理的情況下,往往落入兩種困境,一是處理的時間過長,另外則是產生的關聯法則過多。使用傳統的關聯式法則,過程中需要同時處理龐大的非特定目標,再從中取得特定目標的結果,雖然最後也能取得特定目標的關聯,事實上,決策者可能只對及時的、特定目標發生的關聯有濃厚的興趣,例如:行銷人員於新促銷檔期開始後,觀察消費者對促銷型錄產品購買的行為,以預期銷售額能否達成營業目標。資訊的時效性與準確性,在選擇處理的方式時就已經決定。因此我們提出針對特定目標,進行關聯式法則分析的方式,稱為目標關聯式法則資料探勘演算法(Goal Association Rule,簡稱GAR)。
英文摘要
The association rule analysis all transaction in order to find out unknown rules between items. Mining millions transactions without specific target often fail into a corner: one is taking time process, another is more than sufficient rules.Although traditional association rule eventually will obtain association of specific target after dealing with huge unwanted datum. Acturally timely association on specific targets might be most evaluated by decision makers. For example, marketing people observe customer behavior about catalog products during new promotion activity to predict sales amount reaching profit targets.Therefore, we proposed Goal Association Rule algorithm(GAR) aim at specific targets mining desired association rule.
第三語言摘要
論文目次
目    錄
目錄 Ⅰ
圖目錄 III
第一章 緒論	1
1.1 研究動機	1
1.2 研究內容	2
1.3組織架構	3
第二章 背景知識	5
2.1 關聯式法則分析	5
2.2 Apriori演算法	13
2.3 DIC(Dynamic Itemset Count)演算法	17
2.4 Pincer-Search演算法	18
2.5 DLG(Direct Large itemsets Generation)演算法	20
2.6 Partition演算法	24
第三章 研究方法	27
3.1目標關聯式法則	27
3.2目標關聯式法則分析的六個階段	31
第四章 實驗結果	62
4.1實驗說明	62
4.2 實驗結果	65
第五章 結論	75
參考文獻	76
英文論文	79

 
圖  目  錄

Fig 2.1一般化(分類階層)示意圖	8
Fig 2.2 support與confidence定義	11
Fig 2.3 Apriori 演算法之架構圖	14
Fig 2.4 Apriori演算法	15
Fig 2.5聯結及刪除程序	16
Fig 2.6 DLG資料庫	22
Fig 2.7 DLG中L1和Bit-Map	22
Fig 2.8 DLG有向圖	23
Fig 2.9 Partition 演算法	26
Fig 3.1 Class設定示意圖	31
Fig 3.2 Distinct count演算法	32
Fig 3.3 Distinct_count_gen運作流程圖	33
Fig 3.4目標關聯式法則支持度與信賴度定義	36
Fig 3.5目標關聯式法則符合最小支持度的交易筆數定義門檻值	37
Fig 3.6傳統關聯式法則產生不需要的候選項目集示意圖	41
Fig 3.7 Class exists exclusive(CEE)定義	43
Fig 3.8 Class exists exclusive演算法	43
Fig 3.9 Large 1-itemsets	45
Fig 3.10 Large 2-itemsets	48
Fig 3.11 Large 3-itemsets	49
Fig 3.12 Large 4-itemsets	50
Fig 3.13 Large 5-itemsets	51
Fig 3.14 Candidate Rule內所有項目集的Confidence值	52
Fig 3.15 Class exists exclusive with composite item演算法	53
Fig 3.16不達Min_Sup 的Candidate 2-itemsets合併產生複合後項	56
Fig 3.17 Candidate 2-itemsets複合後項產生複合後項關聯式法則	57
Fig 3.18 Candidate 2-itemsets產生更長長度複合後項	58
Fig 3.19所有顯著的關聯式法則	60
Fig 4.1資料筆數分布情形	62
Fig 4.2購買顧客年齡Class設定	64
Fig 4.3傳統關聯式法則產生的Candidate筆數	65
Fig 4.4目標關聯式法則只用distinct_item產生Candidate筆數	66
Fig 4.5目標關聯式法則GAR1產生的Candidate筆數	68
Fig 4.6目標關聯式法則GAR1產生的Large Item筆數	68
Fig 4.7目標關聯式法則GAR2產生的Candidate筆數	70
Fig 4.8目標關聯式法則GAR2產生的Large Item筆數	70
Fig 4.9 所有顯著的關聯式法則	71
Fig 4.10顯著的複合式後項關聯式法則	72
Fig 4.11各種關聯式法則產生候選項目集的筆數	73
Fig 4.12各種關聯式法則產生Large itemset的處理時間	74
參考文獻
參考文獻

[1].	R. Agrawal, T. Imielinski, A. Swami, “Mining Association Rules between Sets of Items in Large Databases,” Proceedings of the 1993 ACM SIGMOD Conferencen on Management of Data, Washington D.C., pp. 207-216, May 1993.

[2].	R. Agrawal, H. Mannila, R. Srikant, H. Toivonen, and A. I. Verkamo, “Fast Discovery of Association Rules,” Advances in Knowledge Discovery and Data Mining, U. Fayyad, G. Piatetsky-Shapiro, P. Smyth, and R. Uthurusamy, eds., AAAI/MIT Press, pp. 307-328, 1996.

[3].	S. Brin, R. Motwani, J. Ullman, and S. Tsur, “Dynamic Itemset Counting and Implication Rule for Market Basket Data,” Proceedings of the 1997 SIGMOD Conference on Management of Data, pp. 255-264, 1997.

[4].	J. Han, J. Pei, and Y. Yin, “Mining Frequent Patterns without Candidate Generation,” Proceedings of the 2000 ACM SIGMOD Conference on Management of Data, Dallas, Texas, USA, pp. 1-12, May 2000.

[5].	J. Hipp, U. Güntzer, and G. Nakhaeizadeh, “Algorithms for Association Rule Mining – A General Survey and Comparison,” SIGKDD Explorations, Vol. 2, Issue 1, pp. 58-64, 2000.

[6].	Osmar R. Zaïane and Maria-Luiza Antonie, “Classifying text documents by associating terms with text categories,” Australian Computer Science Communications ,Vol. 24 ,  Issue 2,pp. 215- 222, Jan.-Feb. 2002.

[7].	Jiawei Han & Micheline, “Data Mining Concepts and Techniques,” MORGAN KAUFMANN Publishers, ISBN 1-55860-489-8.

[8].	J. Han and Y. Fu, “Mining Multiple-level Association Rules in Large Databases,” IEEE Trans. on Knowledge and Data Eng., Vol. 11. No. 5, pp. 798-805, 1999.

[9].	A. Savasere, E. Omiecinski, S. Navathe, “An Efficient Algorithm for Mining Association Rules in Large Database,” Proc. 21th VLDB, Zurich, Switzerland, pp. 432-444, 1995. 

[10].	H. Toivonen, “Sampling large databases for association rules,” In Proc. 22nd VLDB Conference, Bombay, India, pp. 134-145,Sep. 1996.

[11].	J. Han, J. Pei, and Y. Yin, “Mining frequent patterns without candidate generation,” Proc. of the ACM SIGMOD Int’l Conf. on Management of Data, Dallas, Texas, USA, pp. 1-12, May 2000. 
 
[12].	J.S. Park, M.S. Chen, and P.S. Yu, “Using a Hash-Based Method with Transaction Trimming for Mining Association Rules,” IEEE Trans. on Knowledge and Data Eng., vol. 9, no. 5, pp. 813-825, Sep./Oct. 1997. 

[13].	Roberto J. Bayardo Jr., “Efficiently Mining Long Patterns from Databases,” Proc. of the ACM SIGMOD Int’l Conf. On Management of Data, Seattle, Washington, pp. 85-93, June 1998.

[14].	J. Han and Y. Fu, “Discovery of Multiple-Level Association Rules from Large Databases,” Proc. of the 21th VLDB, pp. 420-431, 1995.

[15].	J. Hipp, A. Myka, R. Wirth, and U. Guntzer, “A New Algorithm for Faster Mining of Generalized Association Rules,” Technischer Bericht des Wilhelm-Schickard-Instituts, WSI-98-4, 1998.

[16].	R. Srikant and R. Agrawal, “Mining Generalized Association Rules,” Proc. Of the 21st Int'l Conference on VLDB, Zurich,Switzerland, pp. 407-419, Sep. 1995.

[17].	Ding-An Chiang,Yi-Jen Hu and Cheng-Jung Lin,“Data Mining - Disjunctive Consequent Association Rule Research in Insurance Industry,” Taiwan Insurance Institute Journal, Taiwan.
論文全文使用權限
校內
紙本論文於授權書繳交後1年公開
同意電子論文全文授權校園內公開
校內電子論文於授權書繳交後1年公開
校外
同意授權
校外電子論文於授權書繳交後1年公開

如有問題,歡迎洽詢!
圖書館數位資訊組 (02)2621-5656 轉 2487 或 來信