§ 瀏覽學位論文書目資料
  
系統識別號 U0002-1808201608500100
DOI 10.6846/TKU.2016.00519
論文名稱(中文) 使用LC-KSVD稀疏編碼方法的台灣自然手語辨識系統
論文名稱(英文) Taiwan Sign Language Recognition System Using LC-KSVD Sparse Coding Method
第三語言論文名稱
校院名稱 淡江大學
系所名稱(中文) 電機工程學系碩士班
系所名稱(英文) Department of Electrical and Computer Engineering
外國學位學校名稱
外國學位學院名稱
外國學位研究所名稱
學年度 104
學期 2
出版年 105
研究生(中文) 劉興哲
研究生(英文) Hsing-Che Liu
學號 603440073
學位類別 碩士
語言別 繁體中文
第二語言別
口試日期 2015-07-15
論文頁數 55頁
口試委員 指導教授 - 謝景棠
委員 - 蘇木春
委員 - 謝君偉
關鍵字(中) 手語辨識
稀疏編碼
深度資訊
關鍵字(英) Sign Language Recognition
Sparsing Coding
Depth Image
第三語言關鍵字
學科別分類
中文摘要
手語對聽障人士在溝通上扮演了非常重要的角色。然而,在不同的國家與區域,都發展出屬於當地的一套手語,為此自動的手語識別系統為近年來手語研究的方向。在本文中,本文設計了一套台灣自然手語識別系統。本文採用Kinect2儀器,來獲得由3個手語者各比94種手語詞素3次的數據資料,並從深度影像與人體骨架之關節點座標中獲得手形特徵與軌跡特徵。然後,將這些特徵經由稀疏編碼方法K-SVD和LC-KSVD訓練出個別手語詞素的字典,並以此作辨識使用。
英文摘要
Sign language, for deaf-impaired people, plays an important role in communication. In this paper, we devise a Taiwan Sign Language recognition system. We use the Kinect2 sensor to get data from 94 sign morphemes shown 3 times by 3 people, and extract hand shape features and trajectory features from depth images and joints of the body skeleton. Finally, we have each sign morpheme dictionary trained by K-SVD and label consistent K-SVD (LC-KSVD) sparse coding algorithm for recognition.
第三語言摘要
論文目次
目錄
致謝	I
中文摘要	II
目錄	IV
圖目錄	VII
表目錄	VIII
第一章 緒論	1
1.1 研究動機	1
1.2 研究方法	2
1.3 論文架構	3
第二章 相關研究與背景知識	4
2.1 相關研究	4
2.2 背景知識	5
2.2.1 台灣自然手語	5
2.2.2 Kinect感測器	7
2.2.3 方向梯度直方圖(HOG)演算法	10
2.2.3.1 梯度計算	10
2.2.3.2 方格的方向直方圖劃分	10
2.2.3.3 區塊正規化和描述符區塊	13
2.2.4 K-SVD	13
2.2.5 LC-KSVD	15
2.2.5.1 傳統用於分類之字典訓練	16
2.2.5.2 LC-KSVD訓練	17
2.2.5.3 LC-KSVD分類流程	18
第三章 使用稀疏編碼的台灣自然手語詞素辨識系統	19
3.1 系統架構	19
3.2 系統流程	19
3.2.1 資料擷取	20
3.2.2 軌跡特徵	20
3.2.2.1 關節點遺失偵測與補救	21
3.2.2.2 手語影片的起點、終點,手語詞素的起始幀、結束幀	22
3.2.2.3 長度單位的正規化	23
3.2.2.4 位置上的正規化	24
3.2.2.5 重新取樣	24
3.2.2.6 軌跡位置編碼	24
3.2.3 手形特徵	26
3.2.4 手形軌跡特徵	26
3.2.5 字典訓練	27
3.2.6 辨識階段	27
第四章 實驗結果	28
4.1 實驗環境	28
4.2 實驗的結果	29
4.2.1 K-SVD和LC-KSVD的非獨立測試比較	29
4.2.2 K-SVD的非獨立測試之CMC	29
4.2.3 與其他文獻比較	51
第五章 結論與未來課題	52
5.1 結論	52
5.2 未來課題	52
參考文獻	53
 
圖目錄
圖 2.1手語「破壞」	6
圖 2.2 Kinect v2感測器	7
圖 2.3人體骨架的追蹤	8
圖 2.4人體骨架之25個關節點	9
圖 2.5灰階影像和其G	11
圖 2.6區域的梯度	11
圖 2.7區間顏色劃分	12
圖 3.1系統流程圖	19
圖 3.2手語「服務生」之一連串的深度資訊和關節點	20
圖 3.3預測點的關節點遺失狀況	21
圖 3.4掉落點的關節點遺失狀況	22
圖 3.5手語「但是」片段,上為原軌跡,下為補救軌跡	23
圖 3.6編碼區域示意圖	25
圖 3.7基於關節點的手部區域切割	26
圖 4.1 KSVD非獨立測試之CMC曲線	30
圖 4.2與 [19]方法的辨識率比較	51

 
表目錄
表格 2.1手語詞構的例子	6
表格 2.2資料串流	8
表格 2.3梯度方向的區間劃分	12
表格 4.1 K-SVD和LC-KSVD比較	29
表格 4.2手形軌跡特徵非獨立測試 94 詞素混淆矩陣-1	31
表格 4.3手形軌跡特徵非獨立測試 94 詞素混淆矩陣-2	32
表格 4.4手形軌跡特徵非獨立測試 94 詞素混淆矩陣-3	33
表格 4.5手形軌跡特徵非獨立測試 94 詞素混淆矩陣-4	34
表格 4.6手形軌跡特徵非獨立測試 94 詞素混淆矩陣-5	35
表格 4.7手形軌跡特徵非獨立測試 94 詞素混淆矩陣-6	36
表格 4.8手形軌跡特徵非獨立測試 94 詞素混淆矩陣-7	37
表格 4.9手形軌跡特徵非獨立測試 94 詞素混淆矩陣-8	38
表格 4.10手形軌跡特徵非獨立測試 94 詞素混淆矩陣-9	39
表格 4.11手形軌跡特徵非獨立測試 94 詞素混淆矩陣-10	40
表格 4.12手形軌跡特徵非獨立測試 94 詞素混淆矩陣-11	41
表格 4.13手形軌跡特徵非獨立測試 94 詞素混淆矩陣-12	42
表格 4.14手形軌跡特徵非獨立測試 94 詞素混淆矩陣-13	43
表格 4.15手形軌跡特徵非獨立測試 94 詞素混淆矩陣-14	44
表格 4.16手形軌跡特徵非獨立測試 94 詞素混淆矩陣-15	45
表格 4.17手形軌跡特徵非獨立測試 94 詞素混淆矩陣-16	46
表格 4.18手形軌跡特徵非獨立測試 94 詞素混淆矩陣-17	47
表格 4.19手形軌跡特徵非獨立測試 94 詞素混淆矩陣-18	48
表格 4.20手形軌跡特徵非獨立測試 94 詞素混淆矩陣-19	49
表格 4.21手形軌跡特徵非獨立測試 94 詞素混淆矩陣-20	50
參考文獻
參考文獻
[1] 	蔡素娟、戴浩一、陳怡君, “2015【台灣手語線上辭典】第三版.國立中正大學語言學研究所,” [線上]. Available: http://tsl.ccu.edu.tw/web/browser.htm.
[2] 	William C. Stokoe, Jr., “Sign Language Structure: An Outline of the Visual Communication Systems of the American Deaf,” Journal of Deaf Studies and Deaf Education, pp. 3-37, 2005. 
[3] 	Y. Wu, T. S. Huang, and N. Mathews, “Vision-based gesture recognition: A review,” In Lecture Notes in Computer Science, p. 103–115, 1999. 
[4] 	蔡昆瀛、柯欣蓉, “臺灣地區近十年手語研究文獻之後設分析,” 國小特殊教育, 編號 46, pp. 24-34, 2008. 
[5] 	R. Azad, B. Azad, and I. T. Kazerooni, “Real-time and robust method for hand gesture recognition system based on cross-correlation coefficient,” International Journal of Advanced Computer Science, p. 121–125, 2013. 
[6] 	S. R. Fanello, I. Gori, G. Metta, “Keep It Simple And Sparse: Real-Time Action Recognition,” Journal of Machine Learning Research, pp. 2617-2640, 2013. 
[7] 	C. Sun, T. Zhang, B. Bao, C. Xu and T. Mei, “Discriminative exemplar coding for sign language recognition with kinect,” Cybernetics, pp. 1418-1428, 2013. 
[8] 	N. Dalal and B. Triggs, “Histograms of oriented gradients for human detection,” 於 Computer Vision and Pattern Recognition, 2005. 
[9] 	M. Aharon, M. Elad and A. Bruckstein, “K-SVD: An Algorithm for Designing Overcomplete Dictionaries for Sparse Representation,” IEEE Transactions on Signal Processing, pp. 4311-4322, 2006. 
[10] 	Zhuolin Jiang, Zhe Lin, Larry S. Davis, “Learning a Discriminative Dictionary for Sparse Coding via Label Consistent K-SVD,” 於 Computer Vision and Pattern Recognition, 2011. 
[11] 	Zhuolin Jiang, Zhe Lin, Larry S. Davis, “Label Consistent K-SVD: Learning A Discriminative Dictionary for Recognition,” Pattern Analysis and Machine Intelligence, pp. 2651-2664, 2013. 
[12] 	M. Mohandes, M. Deriche, and J. Liu, “Image-Based and Sensor-Based Approaches to Arabic Sign Language Recognition,” HUMAN-MACHINE SYSTEMS, 8 2014. 
[13] 	S. Mo, S. Cheng, X. Xing, “Hand Gesture Segmentation Based on Improved Kalman Filter and TSL Skin Color Model,” 於 International Conference on Multimedia Technology, 2011. 
[14] 	G. Plouffe and A.-M. Cretu, “Static and Dynamic Hand Gesture Recognition in Depth Data Using Dynamic Time Warping,” INSTRUMENTATION AND MEASUREMENT, 2 2016. 
[15] 	X. Wu, X. Mao, L. Chen, Y. Xue, “Trajectory-based view-invariant hand gesture recognition by fusing shape and orientation,” IET Computer Vision, pp. 797-805, 2015. 
[16] 	陳怡君, “台灣地區聾人手語選用情形與現行手語政策之探討,” 國立政治大學語言學研究所碩士論文, 2003.
[17] 	劉秀丹、曾進興、劉俊榮, “自然手語與文法手語的詞彙記憶廣度比較,” 特殊教育研究學刊, 第 冊34, 編號 3, pp. 25-45, 2008. 
[18] 	G. Golub, P. Hansen, and D. O’leary, “Tikhonov regularization and total least squares,” SIAM Journal on Matrix Analysis and Applications, p. 185–194, 1999. 
[19] 	Yongjun Jiang, Jinxu Tao, Weiquan Ye, Wu Wang, Zhongfu Ye, “An Isolated Sign Language Recognition System Using RGB-D Sensor with Sparse Coding,” 於 Computational Science and Engineering, 2014.
論文全文使用權限
校內
紙本論文於授權書繳交後3年公開
同意電子論文全文授權校園內公開
校內電子論文於授權書繳交後3年公開
校外
同意授權
校外電子論文於授權書繳交後3年公開

如有問題,歡迎洽詢!
圖書館數位資訊組 (02)2621-5656 轉 2487 或 來信