§ 瀏覽學位論文書目資料
  
系統識別號 U0002-1907200907360500
DOI 10.6846/TKU.2009.00676
論文名稱(中文) 基於表格分類之行動裝置網頁內容調適
論文名稱(英文) Table Classification for Webpage Transcoding on Mobile Devices
第三語言論文名稱
校院名稱 淡江大學
系所名稱(中文) 資訊管理學系碩士班
系所名稱(英文) Department of Information Management
外國學位學校名稱
外國學位學院名稱
外國學位研究所名稱
學年度 97
學期 2
出版年 98
研究生(中文) 蔡字維
研究生(英文) Tzi-Wei Tsai
學號 696630077
學位類別 碩士
語言別 繁體中文
第二語言別
口試日期 2009-06-07
論文頁數 61頁
口試委員 指導教授 - 周清江
委員 - 廖賀田
委員 - 伍台國
委員 - 黃承龍
關鍵字(中) 表格分類
網頁內容調適
行動運算
關鍵字(英) Table Classification
Web Content Adaptation
Mobile Computing
第三語言關鍵字
學科別分類
中文摘要
為了改善使用者在行動裝置上的網頁瀏覽經驗,已有許多研究
提出不錯的網頁內容調適方法,但是在調適表格區塊部分卻常常因
為對表格之分析不足,導致調適結果破壞原始語意。本研究設計與
實做以表格分類為基礎的行動裝置網頁表格區塊調適系統(TCWT,
Table Classification for Webpage Transcoding on Mobile Devices),除
了引用過去相關研究之分類特徵, 更提出新的分類特徵
COTC(Composite Object Type Consistency, 組合物件型態一致性)用
以描述表格在資料呈現方式之一致性,此系統將各表格分類為資料
表格或排版表格,分別導引不同的調適策略,進行縮放、轉置以及
單欄調適的處理以維持表格原始結構和語意。我們除了實做出此網
頁內容調適系統,最後還透過系統滿意度問卷調查,驗證本系統確
實能有效改善行動裝置上的網頁表格瀏覽經驗。
英文摘要
Many techniques have been proposed to improve internet contents
web browsing experience on the mobile devices. Even though many
adaptation techniques for web pages are successful, the semantics
between table cells are usually broken, due to inadequate table analyzing
of the adaptation techniques. We design and implement a TCWT(Table
Classification for Webpage Transcoding on Mobile Devices) system that
maintain the semantics inside the web tables. We use and revise the
features from related work as our features and propose a new feature
called COTC(Composite Object Type Consistency) to describe the web
tables. After classifying web tables into data tables and layout tables, we
use the result to guide the adaptation strategy for improving the browsing
experience. We not only implement the whole webpage content
adaptation system, but also evaluate the user satisfaction level of our
system.
第三語言摘要
論文目次
目錄
第一章 緒論 1
1.1. 研究背景與動機 1
1.2. 研究目的 2
1.3. 論文架構 3
第二章 文獻探討 4
2.1. 異質性裝置調適 4
2.2. 語意區塊與內容調適 5
2.2.1. 區塊極小化導覽 6
2.2.2. 排版調整 7
2.2.3. 網頁表格調適 9
2.3. 單一編寫 12
2.4. 表格定義與利用機器學習進行表格分類 13
第三章 TCWT 系統設計 17
3.1. 目前表格調適的問題 17
3.2. 解決方法概述 18
3.3. 資料表格與排版表格之定義 19
3.4. 分類特徵之選定 20
3.5. 表格調適策略 24
第四章 TCWT 系統實作 28
4.1 TCWT 系統架構與資料流程設計 28
4.2 表格資料前處理 29
4.3 COTC 特徵演算法 30
第五章 實驗與討論 36
5.1 網頁表格分類元件-分類結果 36
5.2 網頁表格調適元件-根據分類結果導引網頁表格內容調適 43
5.2.1 排版表格之調適 43
5.2.2 資料表格之調適. 44
5.3 TCWT 系統驗證 47
5.3.1 網頁表格內容調適之滿意度問卷調查 47
5.3.2 系統元件執行時間 49
5.4 TCWT 調適結果與相關研究結果之比較 50
5.4.1 表格分析方法 50
5.4.2 分類結果 51
5.4.3 滿意度測試 52
第六章 結論與未來展望 54
參考文獻 56
附錄A:測試網頁內容及調適後之結果 59

圖目錄
圖 1:表格內儲存格關係之範例	13
圖 2:表格語意破壞範例	17
圖 3:排版表格範例	19
圖 4:資料表格範例	19
圖 5:英文網頁單欄調適範例	25
圖 6:中文網頁單欄調適範例	25
圖 7:表格轉置範例	26
圖 8:中文網頁資料表格調適範例	27
圖 9:TCWT系統架構及資訊傳遞流程	28
圖 10:COTC演算法紀錄儲存格個數以及跨欄跨列延伸情況部分	31
圖 11:COTC演算法找出CB區塊部分	33
圖 12:COTC演算法組合型態一致性計算部分	35
圖 13:無加入COTC特徵之決策樹	38
圖 14:加入COTC特徵之決策樹	39
圖 15:資料表格分類成排版表格範例	41
圖 16:資料表格判斷成排版表格範例	42
圖 17:排版表格調適範例	44
圖 18:資料表格調適範例	45
圖 19:大型資料表格切割範例	46
圖 20:TCWT滿意度調查問卷	47
圖 21:網頁A行動裝置上原始網頁內容及調適後結果	59
圖 22:網頁B行動裝置上原始網頁內容及調適後結果	60
圖 23:網頁C行動裝置上原始網頁內容及調適後結果	61

表目錄
表 1:網頁表格分析和調適方式相關研究比較	11
表 2:TCWT所採用之表格特徵	20
表 3:儲存格組合物件型態值	22
表 4:各分類特徵使用之門檻值	37
表 5:TCWT分類結果	40
表 6:TCWT使用滿意度分數表	49
表 7:TCWT各元件執行時間	49
參考文獻
[1] 何承澤,2006,以語意為基礎的異質性裝置網頁內容調適架構,淡江大
學資訊管理研究所碩士論文。
[2] 吳俊杰,2008,利用模糊理論為基礎之內容分析方法以維持網頁視覺連
貫性之內容調適機制,中央大學資訊工程研究所碩士論文。
[3] 林士騏,2007,代理伺服端架構之情境導向內容調適,中央大學資訊工
程研究所碩士論文。
[4] 蔡子宸,2007,自動偵測HTML 語言的語意區塊,中央大學資訊工程
研究所碩士論文。
[5] Artail, H. & Raydan. M. (2005). Device-aware Desktop Web Page
Transformation for Rendering on Handhelds. Personal Ubiquitous
Computing, 9(6), 368-380.
[6] Bulter, M., Giannetti, F., Gimson, R. & Wiley, T. (2002). Device
Independence and the Web. IEEE Internet Computing 6(5), 81-86.
[7] Bickmore, T., Girgensohn, A., & Sullivan, J. (1999). Web Page Filtering
and Re-authoring for Mobile Users. The Computer Journal, 42(6), 334-346.
[8] Chen, H.H., Tsai, S.C. & Tsai, J.H. (2000). Mining Tables from Large Scale
Html Texts. Proceedings of the 18th International Conference on
Computational Linguistics, Saarbrucken, 166-172.
[9] Chen, Y., Xie, X., Ma, W. & Zhang, H. (2005). Adapting Web Pages For
Small-Screen Devices. IEEE Internet Computing Archive, 9(1), 50-56.
[10] Florins, M. (2004). Graceful Degradation: a Method for Designing
Multiplatform Graphical User Interfaces. Ph.D. Thesis, Department of
Management Sciences, Catholic University of Louvain, Belgium.
[11] Gonzllez-Castafio, F.J., Anido-Rifh, L. & Costa-Montenegro, E. (2002). A
New Transcoding Technique for PDA Browsers Based on Content
Hierarchy. Proceedings of the 4th International Symposium on Mobile
Human-Computer Interaction, 69-80.
[12] Hurst, M. (2002). Classifying Table Elements in HTML. Proceedings of the
11th International World Wide Web Conference, 7-11.
[13] Hurst, M. (2006). Towards a Theory of Tables. International Journal on
Document Analysis and Recognition, 8(2-3), 123-131.
[14] He, J., Gao, T., Hao, W. & Yen, I.L. (2007). A Flexible Content Adaptation
System Using a Rule-Based Approach. IEEE Transactions on Knowledge
and Data Engineering, 19(1), 127-140.
[15] Hwang, Y., Kim, J. & Seo, E. (2003). Structure-Aware Web Transcoding
for Mobile Devices. IEEE Internet Computing, 7(5), 14-21.
[16] Hua, Z., Xie, X., Liu, H., Lu, H. & Ma, W. (2006). Design and Performance
Studies of an Adaptive Scheme for Serving Dynamic Web Content in a
Mobile Computing Environment. IEEE Transactions on Mobile Computing,
5(12), 1650-1662.
[17] Ko, P., Kang, S. & Kumar, H. (2008). Web Page Dependent Vision Based
Segmentation for Web Sites. Proceedings of the 7th International
Conference on Computer and Information Science, 690-694.
[18] Laakko, T. & Hiltunen, T. (2005). Adapting Web Content to Mobile User
Agents. IEEE Internet Computing, 9(2), 46-53.
[19] Lum, W.Y. & Lau, F.C. (2002). A Context-Aware Decision Engine for
Content Adaptation, IEEE Pervasive Computing, 1(3), 41-49.
[20] Lum, W.Y. & Lau, F.C.M. (2005). Relationship-aware Content Adaptation
of Structured Web Documents for Mobile Computing. Proceedings of the
11th International Conference on Parallel and Distributed Systems,
168-174.
[21] Pribeanu, C. (2006). Task Modeling for User Interface Design: A Layered
Approach. International Journal of Information Technology, 3(2), 86-90.
[22] Wong, C., Chu, H.H. & Katagiri, M.A. (2002). A Single-Authoring
Technique for Building Device-Independent Presentations. Proceedings of
W3C Workshop on Device Independent Authoring Techniques.
[23] Wang, X. (1996). Tabular Abstraction, Editing, and Formatting. Ph.D.
Thesis, Department of Computer Science, University of Waterloo, Canada.
[24] Wang, Y. & Hu, J. (2002). Detecting Tables in Html Documents.
Proceedings of the 5th International Workshop on Document Analysis
Systems, 249-260.
[25] Wang, Y. & Hu, J. (2002). A Machine Learning Based Approach for Table
Detection on the Web. Proceedings of 11th International World Wide Web
Conference, 242-250.
[26] Wang, C., Xie, X., Wang, W. & Ma, W.Y. (2004). Improving Web Browsing
on Small Devices Based on Table Classification. Proceedings of the 12th
International World Wide Web Conference, 20-24.
[27] Yang, J.H. & Wu, J.J. (2007). Using Content Analysis Technique to Enhance
Content Adaptation System. Proceedings of the 9th IEEE International
Symposium, 23-28.
[28] Xie, X., Wang, C., Chen, L.Q. & Ma, W.Y. (2005). An Adaptive Web Page
Layout Structure for Small Devices. ACM Multimedia Systems Journal,
11(1), 34-44.
論文全文使用權限
校內
紙本論文於授權書繳交後5年公開
同意電子論文全文授權校園內公開
校內電子論文於授權書繳交後5年公開
校外
同意授權
校外電子論文於授權書繳交後5年公開

如有問題,歡迎洽詢!
圖書館數位資訊組 (02)2621-5656 轉 2487 或 來信