跳到主要內容

簡易檢索 / 詳目顯示

研究生: 陳厚安
Hou-An Chen
論文名稱: 自然場景跑馬燈偵測與完整文句重構
A study of detecting and reconstructing marquee texts in natural scenes
指導教授: 范國清
Kuo-Chin Fan
口試委員:
學位類別: 碩士
Master
系所名稱: 資訊電機學院 - 資訊工程學系
Department of Computer Science & Information Engineering
畢業學年度: 100
語文別: 中文
論文頁數: 57
中文關鍵詞: 文字文字偵測
外文關鍵詞: text detection, Mareuee text
相關次數: 點閱:12下載:0
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 現實生活中常常出現很多的資訊傳播媒介,諸如:廣告、電視牆、交通號誌或是跑馬燈,但是當人們面對這麼多傳播媒介的時候總是會不小心有遺漏的狀況出現,而在這之中可能會有很多資訊是對我們有所幫助的,因此,如何輔助人們在資訊快速傳播時,完整的重現以避免錯失接收資訊的機會。本研究針對現實環境中常常出現的跑馬燈作為分析的對象,跑馬燈通常應用於重複提供人們簡短而重要的訊息,但是跑馬燈的顯示範圍有限,往往無法在同一時間顯示完整的訊息,所以會一直不斷更新顯示的訊息。本論文提供一種基於視覺的方法,以幫助人們避免錯失訊息,主要目標是找出跑馬燈位置,並且顯示跑馬燈所顯示過的所有內容。
    本研究透過分析跑馬燈影片的光流值,二值化以及文字區塊標記來擷取欲分析的影像資料,並利用本研究所提出來的過濾機制,將影片時間前後的單張影像中不同樣的文字過濾出來,當跑馬燈影片撥放完畢的時候,本研究會將影片中所出現過的文字做一個完整的重現,讓人們可以減少時間以及錯失接收到跑馬燈文字的狀況。


    Many devices such as advertisements, TV wall, traffic signals and marquee (scrolling text) are delivering multimedia contents in our daily lives. People may miss some important information when facing so many different multimedia contents. This thesis proposes a vision-based approach to assist users avoiding missing information that might be important to them. This study aims the marquee the messages it contains are constantly updating so that people miss part of the contents easily. The purpose of work is to display the full contents shown by a marquee.
    First, the system locates the marquee texts by analyzing the optical flow field. Meanwhile, the starting and ending time of scrolling texts can also be obtained. Second, text blocks are retrieved by the integration of temporal differencing, vertical projection, and histogram matching method. Finally, the content of the marquee is displayed by rearranging these text blocks. Experiments demonstrate that the proposed method can display most texts in the marquee regardless of the language or color of texts.

    摘要 Abstract 致謝 目  錄 圖 目 錄 表 目 錄 第一章 緒論 1-1 研究動機與目的 1-2 相關研究 1-3 系統流程 1-4 論文架構 第二章 跑馬燈區域偵測 2-1 光流演算法 2-2 形態學影像處理 2-3 連通單元演算法 2-4 水平光流分析 第三章 文字區塊偵測與分析 3-1 影像二值化 3-2 二值化影像處理 3-2-1 連續影像相減法 3-2-2 幾何投影法 3-3 分離前景區塊 3-4 破碎區塊過濾 3-5 區塊合併與標記 第四章 動態區塊分析 4-1 不同影像間的區塊對應 4-2 特殊區塊 4-3 辨識重複內容 第五章 實驗結果 5-1 效果評估 5-2 失敗案例 第六章 結論與未來工作 6-1 結論 6-2 未來工作 參考文獻

    [1] A.K. Jain, B. Yu. ”Automatic Text Location in Images and Video Frames”. Pattern Recognition, 1998, pp. 2055-2076.
    [2] Q. Ye, Q. Huang, W. Gao and D. Zhao. “Fast and robust text detection in images and video frames”. Image and Vision Computing, 2005, pp. 565-576.
    [3] C. Liu, C. Wang and R. Dai. “Text Detection in Images Based on Unsupervised Classification of Edge-based Features”. ICDAR 2005, pp. 610-614.
    [4] K. Jung, K. I. Kim, and A. K. Jain. Text information extraction in images and videos: A survey. Pattern Recognition, 37(5):977–997, 2004.
    [5] P. Shivakumara, T. Q. Phan and C. L Tan, “A Robust Wavelet Transform Based Technique for Video Text Detection”, ICDAR, 2009, pp 1285-1289.
    [6] Epshtein, B., Ofek, E., Wexler, Y.”Detecting Text in Natural Scenes with Stroke Width Transform.”In Proc. of IEEE Conf. on Comp. Vis. and Patt. Recog., pp.2963–2970 (2010)
    [7] J. Zhang, “Text Detection Using Edge Gradient and Graph Spectrum”, Pattern Recognition (ICPR), pp.3979–3982(2010)
    [8] C. Jung, Q. Liu, J. Kim, “A stroke filter and its application to text localization”, Pattern Recognition Letters, pp.114–122(2009)
    [9] C.M. Wang, K.C. Fan, C.T. Wang, “Estimating Optical Flow by Integrating Multi-Frame Information”, Journal of Information Science and Engineering 24, 1719-1731 (2008)

    QR CODE
    :::