淡江大學覺生紀念圖書館 (TKU Library)
進階搜尋


下載電子全文限經由淡江IP使用) 
系統識別號 U0002-0407200715360200
中文論文名稱 鏡頭切換偵測與其應用
英文論文名稱 A Study on Video Shot Boundary Detection and Its Applications
校院名稱 淡江大學
系所名稱(中) 資訊工程學系碩士班
系所名稱(英) Department of Computer Science and Information Engineering
學年度 95
學期 2
出版年 96
研究生中文姓名 蔡文宗
研究生英文姓名 Wen-Tsung Tsai
學號 694190249
學位類別 碩士
語文別 中文
口試日期 2007-06-28
論文頁數 80頁
口試委員 指導教授-顏淑惠
委員-徐道義
委員-林慧珍
中文關鍵字 鏡頭  直方圖  快換景  慢換景  畫格  關鍵畫格  影片分類 
英文關鍵字 Shot  Histogram  Abrupt transition  Gradual transition  Frame  Key frame  Shot classification 
學科別分類 學科別應用科學資訊工程
中文摘要 本論文主要由兩部分組成,第一部份中提出一個有效的方法來正確找出在數位影片中每一個鏡頭(shot)的分界點,而第二部分則是使用我們所提出的鏡頭分界偵測演算法對足球影片進行分割,並對針它們進一步地去做分類。
在數位影片的處理中,無論是作搜尋(retrieval)、分類(classify)或是分群(cluster),我們都必須以鏡頭為基本單位去作處理,所以一個正確率高的鏡頭分界偵測演算法便變得十分重要,因為它將會影響所有後續處理的效能與正確性。鏡頭的分界主要分成快換景(abrupt transition)與慢換景(gradual transition)兩種。我們首先會根據影片畫格(frame)個別作統計以得到直方圖(histogram),再計算相鄰畫格之間的相異度,當成之後判斷鏡頭分界的特徵,以此特徵分別對快換景與慢換景使用動態的門檻值去作不同的判斷,之後再找出最足以代表這個鏡頭的關鍵畫格(key frame)。
偵測出鏡頭分界之後,再根據足球影片中所分割出來的鏡頭對去作分類。我們將足球影片分為遠距離鏡頭、中距離鏡頭以及球員特寫這三類,讓使用者能更快速地對影片進行整理。根據所我們提出的方法,對於一般數位影片的分界偵測以及足球影片的分類上皆能夠獲得很高的正確率。
英文摘要 An accurate and reliable shot boundary detection algorithm is essential to many video processing. In this paper, we propose a new shot boundary detection algorithm and a shot classification scheme on detected soccer video shots.
The proposed shot boundary detection algorithm is based on frame-distance histogram. A rough way to classify the tempo of a video sequence, as static, dynamic, or averaging, is proposed. With estimated content tempo, the notorious problem of the gradual transition cuts detection is solved. Our algorithm is tested on various types of videos and proved to be accurate and successful.
For a soccer video, after shot segmentation has been accomplished, the algorithm proceeds to shot classification into three categories: long shots, medium shots and close-up or other shots. The classification algorithm is based on the grass ratio of the frame. The grass ratio is calculated with motion and color features that no pre-training or updating is necessary. The proposed scheme is tested on various soccer video shots with excellent results.
論文目次 目錄:
目錄 I
圖目錄 III
表目錄 V
第一章 緒論. 1
1.1 研究動機與目的 1
1.2 研究內容 2
1.3 論文架構 5
第二章 基礎介紹與相關研究 6
2.1 基礎介紹 6
2.2 顏色空間模型 10
2.3 鏡頭切換偵測相關研究 12
2.4 鏡頭切換偵測之相關應用 16
第三章 鏡頭分界偵測研究方法 22
3.1 畫格差距計算 22
3.2 影片鏡頭分界偵測 24
3.2.1 快換景分界偵測 25
3.2.2 慢換景分界偵測 29
3.3 關鍵畫格萃取 37
第四章 鏡頭分類研究方法 40
4.1 球場草地比率計算 41
4.2 鏡頭分類 47
4.2.1 草地比率≧75% 47
4.2.2 草地比率<75% 49
第五章 實驗結果與探討 54
5.1 實驗結果 54
5.1.1 鏡頭分界偵測實驗結果 56
5.1.2 鏡頭分類實驗結果 61
5.2 影片鏡頭分界偵測相關探討 63
5.3 鏡頭分類相關探討 65
第六章 結論與未來研究方向 66
參考文獻 68
附錄A 英文論文 71

圖目錄:
圖1.1 系統流程圖 4
圖2.1 快換景的鏡頭轉換 7
圖2.2 溶接的鏡頭轉換 8
圖2.3 淡入的鏡頭轉換 9
圖2.4 淡出的鏡頭轉換 9
圖2.5 割接的鏡頭轉換 10
圖2.6 HSI color model 11
圖3.1 區域直方圖之中間區塊 23
圖3.2 畫格差距曲線圖 24
圖3.3 快換景鏡頭切換之特殊情形 27
圖3.4 快換景鏡頭切換偵測之結果 29
圖3.5 高斯平滑化之遮罩 30
圖3.6 經過浸蝕與增長後之曲線圖 33
圖3.7 慢換景發生時畫格之變化 35
圖3.8 影片中動作激烈時畫格之變化 36
圖3.9 鏡頭分界偵測流程圖 39
圖4.1 (a)遠距離鏡頭 40
(b)中距離鏡頭 40
(c)球員特寫或觀眾 40
圖4.2 (a)關鍵畫格 43
(b) PCRM 43
圖4.3 (a)hue為90°時,HSI中S值的變化 44
(b)hue為90°時,HSI中I值的變化 44
圖4.4 (a)關鍵畫格 45
(b) PCRM 45
圖4.5 觀眾席與球場分隔線之偵測結果 46
圖4.6 (a) (b)近距離球員特寫鏡頭 49
圖4.7 中距離鏡頭 51
圖4.8 鏡頭分類流程圖 53
圖5.1 程式介面 56
圖5.2 快換景鏡頭分界偵測之結果 57
圖5.3 單純慢換景鏡頭分界偵測之結果 58
圖5.4 複雜慢換景鏡頭分界偵測之結果 59
圖5.5 鏡頭分類後之結果 62

表目錄:
表5.1 鏡頭切換偵測之實驗數據 60
表5.2 鏡頭分類之實驗數據 63
參考文獻 [1]Alan Hanjalic, “Shot-Boundary Detection: Unraveled and Resolved?”, IEEE Transactions on Circuits and Systems for Video Technology, Vol. 12, No. 2, February 2002.
[2]Liang-Hua Chen, Chih-Wen Su, Hong -Yuan Mark Liao, and Chun-Chieh Shih, “On the preview of digital movies”, J. Vis. Commun. Image R. 14 (2003) 358–368.
[3]Silvio Jamil Ferzoli Guimaraes, Michel Couprie, Arnaldo de Albuquerque Araujo, Neucimar Jeronimo Leite, “Video segmentation based on 2D image analysis”, Pattern Recognition Letters 24 (2003) 947–957.
[4]Hong Lu, Yap-Peng Tan, “Unsupervised clustering of dominant scenes in sports video”, Pattern Recognition Letters 24 (2003) 2651–2662.
[5]Liang-Hua Chen, Yu-Chun Lai, Chih-Wen Su, Hong-Yuan Mark Liao, “Extraction of video object with complex motion”, Pattern Recognition Letters 25 (2004) 1285–1291.
[6]Haoran Yi, Deepu Rajan, Liang-Tien Chia, “A new motion histogram to index motion content in video segments”, Pattern Recognition Letters 26 (2005) 1221–1231.
[7]Young-tae, Kim, Tat-Seng, Chua, “Retrieval of News Video using Video Sequence Matching”, Proceedings of the 11th International Multimedia Modelling Conference (MMM’05).
[8]Zeeshan Rasheed and Mubarak Shah, “Detection and Representation of Scenes in Videos”, IEEE Transactions on Multimedia, Vol. 7, No. 6, December 2005.
[9]Linjun Yang, Hong Lu, Bei Wang, Xiangyang Xue, Yap-Peng Tan, “Shot Boundary Classification and Refinement Using Inter-Frame Similarity Patterns”, Information, Communications and Signal Processing, 2005 Fifth International Conference on 06-09 Dec. 2005 Page(s):673 – 677.
[10]Kin-Wai Sze, Kin-Man Lam, and Guoping Qiu, “A New Key Frame Representation for Video Segment Retrieval”, IEEE Transactions on Circuits and Systems for Video Technology, Vol. 15, No. 9, September 2005.
[11]Ediz Saykol, Ugur Gudukbay, Ozgur Ulusoy, “A histogram-based approach for object-based query-by-shape-and-color in image and video databases”, Image and Vision Computing 23 (2005) 1170–1180.
[12]Selim Aksoy, Member, IEEE and Ozge Cavus, “A Relevance Feedback Technique for Multimodal Retrieval of News Videos”, Serbia & Montenegro, Belgrade, November, 22-24, 2005.
[13]Ahmet Ekin, A. Murat Tekalp, Fellow, IEEE, and Rajiv Mehrotra, “Automatic Soccer Video Analysis and Summarization”, IEEE Transactions on Image Processing, Vol. 12, No. 7, July 2003.
[14]Yi-Hua Zhou, Yuan-Da Cao, Long-Fei Zhang Hong-Xin Zhang, “An SVM-based Soccer Video Shot Classification”, Proceedings of the Fourth International Conference on Machine Learning and Cybernetics, Guangzhou, 18-21 August 2005.
[15]Boon-Lock Yeo and Bede Liu, Fellow, IEEE, “Rapid Scene Analysis on Compressed Video”, IEEE transactions on circuits and systems for video technology, Vol. 5, No. 6, December 1995.
[16]Ramin Zabih, Justin Miller, Kevin Mai, “A Feature-Based Algorithm for Detecting and Classifying Scene Breaks”, ACM International Conference on Multimedia, November
論文使用權限
  • 同意紙本無償授權給館內讀者為學術之目的重製使用,於2007-07-16公開。
  • 同意授權瀏覽/列印電子全文服務,於2007-07-16起公開。


  • 若您有任何疑問,請與我們聯絡!
    圖書館: 請來電 (02)2621-5656 轉 2281 或 來信