§ 瀏覽學位論文書目資料
  
系統識別號 U0002-2606200913081900
DOI 10.6846/TKU.2009.00985
論文名稱(中文) 人臉偵測之Adaboost弱分類器設計
論文名稱(英文) A study on the weak-learners of an AdaBoost classifier for face detection
第三語言論文名稱
校院名稱 淡江大學
系所名稱(中文) 電機工程學系碩士班
系所名稱(英文) Department of Electrical and Computer Engineering
外國學位學校名稱
外國學位學院名稱
外國學位研究所名稱
學年度 97
學期 2
出版年 98
研究生(中文) 鍾維人
研究生(英文) Wei-Jen Chung
學號 695450873
學位類別 碩士
語言別 繁體中文
第二語言別 英文
口試日期 2009-06-12
論文頁數 78頁
口試委員 指導教授 - 謝景棠
委員 - 陳稔
委員 - 蘇木春
委員 - 范欽雄
委員 - 謝君偉
關鍵字(中) Adaboost
樹狀偵測器
人臉偵測
類哈型特徵
關鍵字(英) Adaboost
Tree Structure Detector
Face Detection
Haar-like Feature
第三語言關鍵字
學科別分類
中文摘要
本文提出基於人臉偵測之Haar-like型特徵樹狀結構分類器,訓練加速技巧與分類器放大修正法。在Adaboost的訓練法中,正樣本資料為非理想形狀構成時,將使得演算法使用更多的分類器,且效率不彰,樹狀結構為改善此點所設計。訓練資料的差異會造成不同的分佈值,對被挑選出來的分類器而言,分類器值的高低可以反映分佈值。利用具有分支的節點使得不同分佈,不同分類器值的訓練資料分離,使具有較大差異的資料能夠分別訓練,可減少無效率的分類器產生。訓練出的樹狀分類器可將偵測結果作無預先知識的分類,可供後續處理使用。訓練加速技巧使得訓練的時間複雜度有效地降低。於實作過程中發現,分類器在偵測大圖時的放大過程中,因非整數放大倍率造成分類器具有實數值的形狀,無法對應取得圖片上只有整數位置的像素值,而造成誤差,導致判斷結果不良,故提出分類器放大修正法,可大幅改善Haar-like型特徵放大的盲點。偵測法的改善使得訓練所大量需求的負樣本取得變得容易,有益於訓練出具有普遍性的分類器。
英文摘要
This thesis present the tree structure detector of Haar-like feature for face detector, a training speedup tick, and the feature scale correct method.  In the feature training of Adaboost algorithm, the process adapt much more features for complex positive data, and the additional features are not efficient to the final result.  We propose the tree structure to improve the data path.  The distributions of trained distinct data are separated as high and low, and the difference can be also observed on the value of stage detector.  Tree nodes are used to separate data by their detector values.  In next stage, the data with difference will be trained independently.  It decreases the production of ineffective features, and its data path can be a support of intra data classify.
In my experiments, I found a scaled haar-like feature can’t fetch a pixel with float point position, and the results of detection are worse to the non-scaled feature.  The scaled feature need a proper approximation.  The Scaled Feature Correction method we proposed improve the detect rate of scaled feature.  It also let the gather of negative samples become more easily when we want to train a classifier with generalization.
第三語言摘要
論文目次
目錄
中文摘要	I
英文摘要	II
目錄	III
圖目錄	VIII
表目錄	X
第1章	緒論	1
1.1	生命的引力	1
1.2	人臉偵測	2
1.3	人臉偵測與AdaBoost	3
1.4	研究目的	4
1.5	論文架構	5
第2章	數位影像中的模式識別	6
2.1	模式識別	6
2.2	搜尋與偵測	7
2.3	樣本與分類器	8
2.3.1	樣本	9
2.3.2	樣本正規化	11
2.3.3	特徴、閥值、方向	15
2.3.4	Haar-Like放大修正法	20
2.4	分析方法	24
第3章	Boosting	26
3.1	樣本的權重	27
3.2	合併分類器	28
3.3	取得弱學習	29
3.3.1	弱學習訓練	29
3.3.2	弱學習訓練加速技巧	32
3.4	Boosting程序	39
3.4.1	Adaboost	40
3.4.2	Gentle Adaboost	41
3.4.3	Modest Adaboost	42
3.5	分佈更新策略比較	43
第4章	串級與樹狀結構分類器	44
4.1	串級分類器	44
4.2	樹狀分類器	47
4.3	數值觀察	50
第5章	實驗	53
5.1	實驗資料	53
5.2	Boost實驗	56
5.3	訓練速度實驗	57
5.4	特徴修正法實驗	57
5.4.1	偵測能力	57
5.4.2	能力基準	58
5.4.3	可驗證實驗	58
5.5	結構實驗	61
5.5.1	實驗一	61
5.5.2	實驗二	66
5.5.3	實驗三	68
第6章	結論	71
6.1	結果與結論	71
6.2	未來發展	72
References	74
附錄A	77


圖目錄
圖 2.1人臉定位比例示意圖	13
圖 2.2人臉標定流程圖	13
圖 2.3 HAAR-LIKE特徵形狀與區域示意圖	15
圖 2.4(A)左圖為原始影像(色階0~7) (B)右圖為積分影像	16
圖 2.5 特徵值分佈圖,為某特徵對某樣本庫的示意圖.	19
圖 2.6(A)原始四像素大小特徵(B)橫向放大1.25倍取整數的四捨五入大小特徵(C)另一起始位置的特徵(D)同樣橫向放大1.25倍,但結果不同於(B)	20
圖 4.1串級結構與資料路徑	45
圖 4.2邊界與閥值示意圖	47
圖 4.3樹狀結構單位節點	48
圖 4.4樹狀結構資料路徑	50
圖 4.5特徵與弱學習數量關係	51
圖 4.6強分類器中閥值與輸出關係	52
圖 5.1自行拍攝之人臉樣本(TE1)	55
圖 5.2 GENTLE與MODEST ADABOOST串級分類器的特徵數	56
圖 5.3含特徵放大修正	60
圖 5.4不含特徵放大修正	60


表目錄
表格 2.1四種極差的閥值設定	25
表格 4.1閥值調整前	50
表格 4.2閥值調整後	51
表格 5.1訓練用沒有傾斜角度人臉的資料(TR0)	53
表格 5.2有傾斜角度人臉的資料(TR1)	53
表格 5.3含上下翻轉人臉的資料(TR2)	54
表格 5.4含左右旋轉人臉的資料(TR3)	54
表格 5.5 測試資料(TE1)	54
表格 5.6測試資料(TE2)	54
表格 5.7測試資料(TE3)	55
表格 5.8負樣本庫(TEN)	55
表格 5.9負樣本庫(TRN)	55
表格 5.10特徵放大修正法的實驗比較表	57
表格 5.11特徵能力基準實驗比較表	58
表格 5.12實驗一偵測率與假錯率	61
表格 5.13實驗一特徵數	62
表格 5.14實驗一分支中樣本輸出位置 (上)	64
表格 5.15實驗一分支中樣本輸出位置(下)	65
表格 5.16實驗二偵測能力	66
表格 5.17實驗二特徵數	66
表格5.18實驗二樹狀結構每階特徵數	67
表格 5.19實驗二特徵編號	67
表格 5.20實驗二樣本輸出節點	67
表格 5.21實驗三偵測能力	68
表格 5.22實驗三特徵數	69
表格 5.23實驗三樹狀結構每階特徵數	69
表格 5.24實驗三樣本輸出節點	70
參考文獻
[1]	Y. Freund and R.E. Schapire, A decision-theoretic generalization of on-line learning and an application to boosting, Journal of Computer and System Sciences, Vol.55, 1997, pp. 119 – 139.
[2]	E. Schapire, Experiments with a New Boosting Algorithm, in Proc. Int. Conf. Machine Learning, 1996.
[3]	P. Viola and M. Jones. Robust Real-time Object Detection. In Proc. 2nd Int. Workshop on Statistical and Computational Theories of Vision – Modeling, Learning, Computing and Sampling, Vancouver, Canada, July 2001.
[4]	R. Lienhart, L Liang and A. Kuranov. A detector tree of boosted classifiers for real-time object detection and tracking. in Proc. Multimedia and Expo, Vol.2, 2003, pp. 277-280.
[5]	A. L. C. Barczak, M. J. Johnson and C. H. Messom. Empirical Evaluation of a New Structure for AdaBoost. in proc. 23rd Annual ACM Symposium on Applied Computing (SAC’08), Mar, 2008, pp. 16-20.
[6]	C. Huang, H. Ai, Y. Li and S. Lao. Vector boosting for rotation invariant multi-view face detection. in Proc. the IEEE Computer Vision Conf. (ICCV’05), Vol. 1, Oct. 2005, pp. 446 – 453.
[7]	P.J. Phillips, H. Wechsler, J. Huang, P. Rauss, "The FERET database and evaluation procedure for face recognition algorithms," Image and Vision Computing J, Vol. 16, No. 5, 1998, pp. 295-306.
[8]	P.J. Phillips, H. Moon, S.A. Rizvi, P.J. Rauss, "The FERET Evaluation Methodology for Face Recognition Algorithms," IEEE Trans. Pattern Analysis and Machine Intelligence, Vol. 22, 2000, pp. 1090-1104.
[9]	Yea-Shuan Huang (黃雅軒), A Robust Multiple Oriented-Template Face Detector, IAENG International Journal of Computer Science, 35:3, 2008.
[10]	H. Rowley, S. Baluja, and T. Kanade. Neural network-based face detection. IEEE Pattern Analysis and Machine Intelligence, Vol. 20, 1998, pp. 20-38.
[11]	A. Vezhnevets, V. Vezhnevets. Modest AdaBoost – Teaching AdaBoost to Generalize Better. Graphicon, Novosibirsk Akademgorodok, Russia, 2005.
http://research.graphicon.ru/machine-learning/gmladaboost-matlab-toolbox.html.
[12]	J. Sochman and J. Matas. Inter-stage feature propagation in cascade building with AdaBoost. in Proc. 17th Int. Conf. Pattern Recognition (ICPR'04), Vol 1, 2004, pp. 236 – 239.
[13]	J. Fredman, T. Hastie and R. Tibshirani. Additive logistic regression: A statistical view of boosting. The Annals of Statistics, Vol. 28, No. 2, 2000, pp. 337 – 407.
[14]	M. A. Shoorehdeli, M. Teshnehlab and H. A. Moghaddam. Feature subset selection for face detection using genetic algorithms and particle swarm optimization. In Proc, Networking, Sensing and Control, 2006, pp. 686 – 690.
[15]	O. Tuzel, F. Porikli and P. Meer. Region covariance: a fast descriptor for detection and classification. In Proc. European Conf. on Computer Vision (ECCV), vol. 3954, May, 2006, pp. 589 – 600.
[16]	蘇木春,張孝德,機器學習:類神經網路、模糊系統以及基因演算法則,全華科技圖書有限公司,2003。
[17]	沈啟亮,即時的人臉檢測系統,淡江大學,2004。
[18]	R. C. Gonzalez, R. E. Woods, Digital Image Processing, 2nd ed., Prentice-Hall, 2002.
[19]	Intel Corporation, Open Source Computer Vision Library, Copyright (C) 2000-2006.
論文全文使用權限
校內
校內紙本論文立即公開
同意電子論文全文授權校園內公開
校內電子論文延後至2009-11-19公開
校內書目立即公開
校外
同意授權
校外電子論文延後至2009-11-19公開

如有問題,歡迎洽詢!
圖書館數位資訊組 (02)2621-5656 轉 2487 或 來信