淡江大學覺生紀念圖書館 (TKU Library)
進階搜尋


下載電子全文限經由淡江IP使用) 
系統識別號 U0002-2207201402413500
中文論文名稱 音樂指揮軌跡之機器學習─以Kinect為例
英文論文名稱 Machine Learning of Music Conducting Track - implement in KINECT
校院名稱 淡江大學
系所名稱(中) 資訊管理學系碩士班
系所名稱(英) Department of Information Management
學年度 102
學期 2
出版年 103
研究生中文姓名 林羽靖
研究生英文姓名 Yu-Ching Lin
電子信箱 l2s8032@gmail.com
學號 602630088
學位類別 碩士
語文別 中文
口試日期 2014-06-21
論文頁數 63頁
口試委員 指導教授-侯永昌
委員-戴敏育
委員-謝禎冏
中文關鍵字 人機介面  Kinect  機器學習  模板辨識 
英文關鍵字 Human Computer Interface  Kinect  Machine Learning  Template Recognition 
學科別分類
中文摘要 樂器的演奏形式,是從一開始的一人獨奏,漸漸地演變成多人合奏的龐大規模,使得樂隊成員們在合奏出一首音樂曲目時,因而變得困難,此時,開始有一種專業的音樂藝術家出現,我們稱作音樂指揮家。透過樂隊成員們的服從,音樂指揮家將樂隊成員們的獨奏紛紛連結起來,形成一個具有整體性的音樂作品來呈現給台下的聽眾。
音樂指揮家必須對演奏的音樂曲目有一定的認識與了解,才有可能演奏出一部完整的音樂作品。指揮家的職責主要是給定演奏音樂曲目的節奏,並且協調樂隊中的多個聲部來達到一個整體。聽眾也能藉由演奏的成果來感受到樂隊與音樂指揮家對於其演奏的音樂曲目的詮釋。有鑑於此,本文的研究正是希望能給予一般人一個機會,來體驗與享受身為一個音樂指揮家的經驗與樂趣。
本研究擬建構一個音樂指揮軌跡之機器學習的系統,讓一般人有一個機會,來體驗與享受身為一個音樂指揮家的經驗與樂趣。藉由Kinect來抓取音樂指揮家的動作資訊,系統會透過機器學習的方式來學習與預測音樂指揮家的指揮手勢,並且使用midi-dot-net 這套開放原始碼來編寫音樂曲目,並且進行音樂播放的控制。
英文摘要 Playing in the form of musical instruments, from the beginning of one solo, gradually evolved into more than the sheer size of the ensemble, thus, making the ensemble of a music track becomes difficult, at this time, a role of the professional music artist began to appeared, we called music conductor. Through obedience of band members, music conductor links their solos together to form a integral music to be presented to the audiences.
Music conductor must have a lot of knowledge and understanding of the music tracks which the band will play , and then they would be possible to play out a complete piece of music. The main responsibilities of the conductor is given rhythm playing music tracks, and coordination of multiple parts orchestra to reach a whole. Listeners also can know the interpretation of music tracks of them. For this reason, we hope to give ordinary people a chance to experience and enjoy being a music conductor and fun experience.
This study intends to build a music conductor track of machine learning system that allows the average person to have a chance to experience and enjoy as a music conductor and fun experience. With Kinect to capture music conductor action, information system can through machine learning approach to learning and prediction commanding of gesture of music conductor, and we write music tracks to control music playback with midi-dot-net which is a set of open source.
論文目次 目錄
目錄 i
表目錄 iii
圖目錄 iv
1. 緒論 1
1-1. 研究背景 1
1-2. 研究動機 2
1-3. 研究目的 3
1-4. 論文架構 3
2. 文獻探討 5
2-1. Kinect簡介 5
2-2. 關於「軌跡」 7
2-3. midi-dot-net 8
2-4. 黃金區段搜尋(Golden Section Search) 11
2-5. 相關研究 12
3. 系統架構與研究方法 19
3-1. 人體骨架偵測 19
3-2. 顯示監測關節點的初始軌跡 21
3-3. 正規化軌跡數據 22
3-4. 軌跡資料分類模型建構 27
3-5. 將正規化後的軌跡用資料分類模型預測 28
3-6. 基於預測結果來改變系統播放音樂的速度與音量 29
4. 實驗 31
4-1. 實驗環境 31
4-2. 控制音樂播放節奏與音量 31
4-3. 軌跡捕捉與手勢偵測實驗 32
4-4. 整合「音樂播放控制、軌跡捕捉與手勢偵測」的功能 33
4-5. 系統實測 36
5. 使用者研究(User Study) 47
5-1. 使用性 49
5-2. 學習性 51
5-3. 需求度 52
5-4. 使用者介面接受度 53
5-5. 系統主要功能之準確程度 53
6. 結論 56
7. 未來展望 58
8. 參考文獻 59
9. 附錄 62

表目錄
表1. 音調與音符之對照表 10
表2. 攝影畫面下方的四個按鈕的功能說明 34
表3. 每位使用者(User)針對每一道題目(Question)所選擇的答案的對應分數 47
表4. 每一道題目(Question)所被選擇的答案項目個數統計 48

圖目錄
圖1. Kinect內部結構(Webb & Ashley, 2012) 6
圖2. 使用Kinect偵測該使用者右手掌關節軌跡之畫面 7
圖3. 黃金區段搜尋示意圖(Wikipedia, 2013) 11
圖4. 系統架構流程圖 19
圖5. Kinect 偵測人體骨架與關節點軌跡之畫面 20
圖6. 軌跡初始化 22
圖7. 軌跡正規化為固定點數 23
圖8. 將軌跡中的第一個點旋轉至x軸( y = 0 )上 24
圖9. 將軌跡調整為1 x 1的參照級距 26
圖10. 將軌跡之中心位置移至原點 27
圖11. 音樂播放器之架構流程圖 30
圖12. 控制音樂播放節奏與音量──實驗 32
圖13. 軌跡捕捉與手勢偵測──實驗 32
圖14. 整合後的使用者介面 33
圖15. 音樂曲目:Mary Had a Little Lamb之樂譜 35
圖16. 系統偵測到未連接Kinect設備時之訊息提示視窗 37
圖17. 未連接Kinect設備時的系統使用者介面 37
圖18. 已連接Kinect設備時的系統使用者介面 39
圖19. 本階段所使用到的使用者介面下方的部分 39
圖20. 按下NewGesture按鈕後所跳出的右側列表(上半部) 40
圖21. 未輸入手勢名稱就按下NewGesture按鈕後的提示訊息 41
圖22. 按下SaveGesture按鈕會自動跳出檔案儲存之視窗 44
圖23. 按下LoadGesture按鈕跳出供選擇愈載入檔案之瀏覽視窗 45
圖24. 右下角顯示被預測到的音樂指揮手勢與預測之時間 46
參考文獻 Body, Human Action Recognition Using Human. (2011). 結合馬可夫模型以人體簽章辨識人體動作.
Chai, X., Li, G., Lin, Y., Xu, Z., Tang, Y., Chen, X., & Zhou, M. (2013). Sign language recognition and translation with kinect. Paper presented at the IEEE Conf. on AFGR,
Chen, S., Maeda, Y., & Takahashi, Y. (2012). Music conductor gesture recognized interactive music generation system. Paper presented at the Soft Computing and Intelligent Systems (SCIS) and 13th International Symposium on Advanced Intelligent Systems (ISIS), 2012 Joint 6th International Conference On, 840-845.
David Catuhe. (2013). In 古成泉 (Ed.), 寫給專業開發者用的Windows kinect SDK技術手冊 (JavaHand Trans.). (初版 ed.). 新北市: 博碩文化.
Odowichuk, G., Trail, S., Driessen, P., Nie, W., & Page, W. (2011). Sensor fusion: Towards a fully expressive 3D music control interface. Paper presented at the Communications, Computers and Signal Processing (PacRim), 2011 IEEE Pacific Rim Conference On, 836-841.
Webb, J., & Ashley, J. (2012). Beginning kinect programming with the microsoft kinect SDK Apress.
Wikipedia. (2013). Golden section search. Retrieved from http://en.wikipedia.org/wiki/Golden_section_search
Yoo, M., Beak, J., & Lee, I. (2011). Creating musical expression using kinect. Paper presented at the International Conference on New Interfaces for Musical Expression, Yonsei University, South Korea,
劉品如, 裴駿, & 孫天龍. (2013). 以 kinect 為基礎之遠距虛擬替身互動技術開發高齡者關懷平台. 福祉科技與服務管理學刊, 1(2), 57-71.
張哲瑋. (2013). 運用色塊追蹤與分析辨識人體動作. 淡江大學資訊工程學系碩士班學位論文,
蕭貴霙. (2007). 互動介面設計與評估-以高齡者資訊介面設計為例,
蘇木春, & 林紘毅. (2013). 一種簡易之動作辨識系統及其於 [全肢體反應] 英語教學互動系統之應用. 前瞻科技與管理, 3(2), 15-27.
黃識夫. (2011). 應用 kinect 之人體多姿態辨識. 中央大學電機工程學系學位論文, , 1-90.
論文使用權限
  • 同意紙本無償授權給館內讀者為學術之目的重製使用,於2015-07-24公開。
  • 同意授權瀏覽/列印電子全文服務,於2015-07-24起公開。


  • 若您有任何疑問,請與我們聯絡!
    圖書館: 請來電 (02)2621-5656 轉 2281 或 來信