系統識別號 | U0002-3108201600355900 |
---|---|
DOI | 10.6846/TKU.2016.01106 |
論文名稱(中文) | 多重部份相似影像的廣域特徵描述器研討 |
論文名稱(英文) | A Global Feature Descriptor for Locally Similar Images |
第三語言論文名稱 | |
校院名稱 | 淡江大學 |
系所名稱(中文) | 資訊工程學系碩士在職專班 |
系所名稱(英文) | Department of Computer Science and Information Engineering |
外國學位學校名稱 | |
外國學位學院名稱 | |
外國學位研究所名稱 | |
學年度 | 104 |
學期 | 2 |
出版年 | 105 |
研究生(中文) | 栢啟鈞 |
研究生(英文) | Chi-Chun Pai |
學號 | 799410187 |
學位類別 | 碩士 |
語言別 | 繁體中文 |
第二語言別 | 英文 |
口試日期 | 2016-07-11 |
論文頁數 | 49頁 |
口試委員 |
指導教授
-
汪柏(wang@cs.tku.edu.tw)
委員 - 謝文恭(wgshieh@faculty.pccu.edu.tw) 委員 - 洪文斌(horng@mail.tku.edu.tw) |
關鍵字(中) |
Global Context Descriptor SIFT 特徵描述器 |
關鍵字(英) |
SIFT Global Context Global Feature Descriptor Sample Keypoint |
第三語言關鍵字 | |
學科別分類 | |
中文摘要 |
影像處理技術中,有許多基礎的研究議題存在,舉凡圖形辨識、人臉辨識、影像拼接、3D建模、圖形比對等應用,皆有一共同的基礎方法:從圖形中找出某些特徵點(feature points),再經過比對(matching)達到定位的目的。特徵點的定義與找尋,雖然基礎但並不簡單且影響深遠。一開始能將許多不同角度獲取的圖形中相同位置正確無誤的對應出來,接下來的步驟將會是工半而事倍;反之如果存在錯誤的對應,則會引後續處理極大的麻煩。本篇論文所要研討的議題即為從圖形中提取依據各像素(pixels)的鄰近區域的特徵點,再對特徵點作描述,成為區域性特徵描述器,另外加入圖像大範圍資訊,成為廣域特徵描述器,並在不同部份對稱影像間比對,提高圖形比對(match)的準確率,而不會誤判。 在此篇論文中,將以 Scale Invariant Feature Transform (SIFT) 為基礎,研究 SIFT 的演算法,對原圖片縮放和高斯模糊產生高斯金字塔差,並提取其中的關鍵點,並提高抗噪訊能力,以及增加比對的穩定性;再分配關鍵點基準方向,使得特徵描述器具有旋轉不變性;最後再增加廣域描述器資訊,使得部份相似圖形中,可以增加比對準確性。 在此將使用Open Source的Library OpenSIFT為基礎,實作 Global Context Feature Descriptor,再取相似性高的各種不同圖片,套用實作的執行結果,並與原始的OpenSIFT作比較,以驗證所實作出的方法是可改善相似性高的影像比對正確率和速度。 本論文主要研究關鍵在於SIFT在相似性高的圖片中,利用本地特徵描述器與廣域特徵描述器的廣域資訊作結合,來減少圖像比對錯誤的錯誤比率,以及使用SIFT加GC和Sample Keypoints來加速比對速度。例如棋盤中有許多相似區域,使用棋盤來比較驗証實作比對的結果與OpenSIFT比對的結果。 |
英文摘要 |
In image processing, there are many basic research topics, for example, image recognition, face detection, image stich, 3D reconstruction, image matching applications, there is a same basic method: To extract feature points from image, through match to reach the goal of location. The definition and search from feature points, although basic, it is not simple but influence deeply; To correctly extract same position but difference angle from beginning, next steps will be work half the things times; On the contrary, if exist mismatch, subsequent processing great trouble is thrown. The topic of research discussion from the thesis is extract interest feature point according to every pixels neighbor area from image, then describes it, become local feature descriptors. Besides of this, adding global context information, as global feature descriptors, utilized them to match between images, increase the precise rate of matching, rather than mismatch. In the thesis, depends on “Scale Invariant Feature Transform”(SIFT), studying the algorithm of SIT, Scaling and Gaussian Blurring image to produce the Gaussian pyramid, then extract keypoint, increase the ability for noise, and stability for matching; Then to assign orientation for keypoint, let feature descriptor to be invariant to image rotation; Finally, adding the global descriptor information, so increase the matching ability for the partially similar image. Base on using the OpenSIFT library, which were written by Rob Hess, implement Global Context Feature Descriptor, to take many highly partially similar image, experiment the result, to compare with the result experiment by OpenSIFT, to exam if the method can improve the correct matching and speed. The thesis major in researching improved the incorrect matching rate between highly similar image; To utilize the combination of Global Feature Descriptors global information and local feature descriptors to decrease incorrect matching. For example, checkerboard has many similar areas, to verify if the matching rate improved then OpenSIFT is we are compared. |
第三語言摘要 | |
論文目次 |
第一章 緒論 1 1.1 前言 1 1.2 研究動機 2 1.3 研究目的 2 1.4 論文內容大綱 3 第二章 背景知識 4 2.1 尺度不變特徵轉換 (Scale Invariant Feature Transform, SIFT) 4 2.1.1 尺度空間極值檢測 4 2.1.1.1 尺度空間 5 2.1.1.2 高斯差分金字塔 (Difference of Gaussian Pyramid) 6 2.1.1.3 極值檢測 (Extrema detection) 9 2.1.2 關鍵點定位 (Keypoint localization) 10 2.1.2.1 精確定位 (Accurate localization) 10 2.1.2.2 消除邊緣響應 (Eliminating edge responses) 11 2.1.3 方向定位 (Orientation assignment) 12 2.1.4 關鍵點描述器 (Keypoint descriptor) 14 2.1.5 比對 (Matching) 16 2.2 加速穩健特徵(Speeded Up Robust Features, SURF) 17 2.2.1 偵測興趣點 (Interest Point Detection) 17 2.2.1.1 積分圖像 (Integral Images) 17 2.2.1.2 海森矩陣 (Hessian Matrix) 18 2.2.2 尺度空間描述與特徵點定位 (Describe Scale space and Locate Feature point) 19 2.2.3 興趣點描述與比對 (Interest Point Description and Matching) 19 2.2.3.1 方向定位 (Orientation Assignment) 20 2.2.3.2 計算描述器 (Descriptor Calculation) 20 2.2.3.3 快速索引比對 (Fast Indexing for Matching) 21 2.3 梯度位置和方向直方圖(Gradient Location and Orientation Histogram, GLOH) 21 2.4 廣域特徵描述器(Global Feature Descriptor) 22 2.4.1 曲率影像 (Curvature image) 22 2.4.2 對數極座標 (Log polar) 23 2.4.3 描述器統計 24 2.4.4 比對方式 24 2.5 OpenCV 26 2.6 OpenSIFT 26 第三章 SIFT算法的改進 27 3.1 SIFT+GC比對流程圖 27 3.2 SIFT+GC特徵尋找流程圖 29 3.3 SIFT+GC改進方案 30 3.4 OpenSIFT的編譯環境 35 第四章 研究結果探討 36 4.1 SIFT比對結果 37 4.2 SIFT+GC+AR大於0.8比對結果 38 4.3 實驗結果 38 第五章 未來展望及討論 40 參考文獻 42 附錄-英文論文 44 圖目錄 圖2-1 高斯拉普拉斯與高斯差分的比較 6 圖2-2 高斯差分金字塔的生成 7 圖2-3 DoG空間極值檢測 9 圖2-4 左圖為邊緣消除前,右圖為邊緣消除後 12 圖2-5 關鍵點直方圖 13 圖2-6 關鍵點描述器梯度方向分配 16 圖2-7 右圖為GLOH圖形 21 圖2-8 對數極座標 23 圖3-1 SIFT+GC比對流程圖 27 圖3-2 SIFT+GC特徵尋找流程圖 29 圖3-3 左圖棋盤圖,右圖旋轉棋盤圖,皆為2048*1536 31 圖3-4 左圖棋盤圖,右圖旋轉棋盤圖,皆為1024*768 31 圖3-5棋盤圖2048*1536,左圖SIFT比對結果,總共444比對上,261錯比對,誤比對率58.78%,右圖SIFT+GC比對結果,總共102比對上,23錯比對,誤比對率22.54% 32 圖3-6 棋盤圖1024*768, 左圖SIFT比對結果, 總共147比對上,51點錯比對,誤比對率34.69%,右圖SIFT+GC比對結果, 總共56比對上,4點錯比對,誤比對率7.14% 32 圖3-7 蟲圖像a 33 圖3-8蟲圖像b 33 圖3-9 OpenSIFT比對結果,比對56點,13點錯誤,誤比對率23% 34 圖3-10 SIFT+GC比對結果,比對上6點,無比對錯點,誤比對率0% 34 圖3-11 SIFT+GC+閥值15 比對結果,比對上10點,且全正確,誤比對率0% 35 圖4-1 圍棋原始圖片 36 圖4-2 象棋原始圖片 36 圖4-3 SIFT比對結果 37 圖4-4 SIFT+GC+AR大於0.8比對結果 38 表目錄 表2-1 圖像金字塔大小與層數關係圖 8 表2-2 SIFT和SIFT+GC+Sample Keypoint比對速度表 31 |
參考文獻 |
[1] David G. Lowe, “Distinctive Image Features from Scale-Invariant Keypoints.”, International Journal of Computer Vision, 60:91-110, 2004. [2] David G. Lowe. “Object recognition from local scale-invariant features.”, International Journal of Computer Vision, 1999. [3] E.N. Mortensen, Hongli Deng, and L. Shapiro., “A SIFT descriptor with global context.”, Computer Vision and Pattern Recognition, 2005. IEEE Computer Society Conference on, volume 1, pages 184-190 vol. 1, June 2005. [4] S. Belongie, J. Malik and J. Puzicha, “Shape matching and object recognition using shape contexts,” PAMI, 24(4):509-522, 2002 [5] S. Belongie, J. Malik and J. Puzicha, “Shape context: A new descriptor for shape matching and object recognition,” in NIPS, pp. 831-837, 2000. [6] K. Mikolajczyk and C. Schmid, “A performance evaluation of local descriptors,” in CVPR, pp. 257-264, 2003. [7] C. Harris and M. Stephens, “A combined corner and edge detector,” in Fourth Alvey Vision Conf., pp. 147-151, 1988 [8] C. Steger, “An unbiased detector of curvilinear structures,” PAMI, 20(3):113-125, 1998. [9] Demo Software: SIFT Keypoint Detector http://www.cs.ubc.ca/%7Elowe/keypoints/ [10] OpenCV. http://opencv.org [11] Rob Hess, “An Open-Source SIFT Library”, ACM MM, 2010. [12] OpenSIFT. https://robwhess.github.io/opensift |
論文全文使用權限 |
如有問題,歡迎洽詢!
圖書館數位資訊組 (02)2621-5656 轉 2487 或 來信