系統識別號 | U0002-0603201914130500 |
---|---|
DOI | 10.6846/TKU.2019.00147 |
論文名稱(中文) | 地點指示詞相似度之研究 |
論文名稱(英文) | Research on similarity of deixis and spatial orientation |
第三語言論文名稱 | |
校院名稱 | 淡江大學 |
系所名稱(中文) | 資訊工程學系碩士班 |
系所名稱(英文) | Department of Computer Science and Information Engineering |
外國學位學校名稱 | |
外國學位學院名稱 | |
外國學位研究所名稱 | |
學年度 | 107 |
學期 | 1 |
出版年 | 108 |
研究生(中文) | 孫聖元 |
研究生(英文) | Shen-Yuan Sun |
學號 | 604410646 |
學位類別 | 碩士 |
語言別 | 繁體中文 |
第二語言別 | |
口試日期 | 2019-01-09 |
論文頁數 | 21頁 |
口試委員 |
指導教授
-
蔡憶佳
委員 - 林慶昌 委員 - 顏淑惠 |
關鍵字(中) |
結巴 爬蟲 地址分析 座標轉換 |
關鍵字(英) |
Jeiba Datamining Address analysis Coordinate transformation |
第三語言關鍵字 | |
學科別分類 | |
中文摘要 |
資訊發達的年代,雖然地圖非常方便,但是仍有許多偏鄉地方或是山上的救援系統並 不是那麼完善,再加上救難人員如果對當地不熟悉,則會發生找不到路等狀況,此研 究就是想辦法將地址整合,讓救難人員可以輕易得到正確的地址,並規劃下一步救難 路徑。 |
英文摘要 |
In the age of information development. Although maps of the internet are very convenient, however, countryside rescue systems are not very perfect. Besides, if the rescuer is not familiar with the local area, there will be no way to find the road, or find the wrong way, maycause the rescue delayed. This research is to find ways to integrate and correct the addresses, so that the rescuer can easily get the correct address, and plan the best rescue paths. |
第三語言摘要 | |
論文目次 |
1 前言 ..........................................1 2 資料處理 .......................................2 2.1 資料量化..................................... 2 2.2 逐點相對訊息(PMI) ............................. 2 2.3 隱性語言分析(LSA) ............................. 3 2.4 Siamese...................................... 4 2.4.1 SiameseNetwork............................. 4 2.4.2 LOSS函數的設計............................ 4 2.4.3 LSTMSiameseNetwork......................... 4 2.5 WMD(WordMover’sDistance)移詞距離.................... 4 2.5.1 Word2vector ............................... 4 2.5.2 詞袋模型(BagofWords)....................... 5 2.5.3 WMD移詞距離 ............................. 5 2.6 相似度計算.................................... 5 2.7 計算詞頻..................................... 6 2.8 系統應用..................................... 6 2.9 研究方法與系統架構 .............................. 7 2.10 遇到的問題.................................... 7 3 電線杆定位 .......................................8 3.1 利用電線杆定位................................. 8 4 文章分群及地址分析 ......................................10 4.1 文章分群..................................... 10 4.2 LatentSemanticAnalysis............................. 10 4.3 地址分析系統 .................................. 11 4.3.1 分析點到點的距離 ........................... 12 4.4 路網分析功能 .................................. 12 4.5 實驗結果..................................... 13 5 總結與未來展望 ............................15 Bibliography...........................16 ----------------------------------------- 圖目錄 2.1 word2vec ..................................... 5 2.2 cosine夾角.................................... 6 3.1 國際麥卡托(UTM)投影............................. 9 3.2 座標轉換流程 .................................. 9 4.1 地址分析系統 .................................. 11 4.2 表1........................................ 12 4.3 流程圖 ...................................... 13 4.4 分析結果..................................... 13 ------------------------------------------- 表目錄 2.1 詞頻 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 |
參考文獻 |
郝志揚[2017] 使用文字探勘實作新聞事件追蹤 淡江大學 台灣電力公司[2016] 台灣電力公司電桿坐標及桿號 梳下魚[2019] 唐詩掠影:基於詞移距離(Word Mover's Distance)的唐詩詩句匹配實踐 xyjisaw[2018] 基於WMD(詞移距離)的句⼦相似度分析簡介 蔡憶佳[2019] 簡介字詞語意相關性統計演算法 淡江大學 |
論文全文使用權限 |
如有問題,歡迎洽詢!
圖書館數位資訊組 (02)2621-5656 轉 2487 或 來信