跳到主要內容

簡易檢索 / 詳目顯示

研究生: 黃盈彬
Ying-Pin Huang
論文名稱: 不連續序列資料挖掘之研究—以股市為例
指導教授: 謝浩明
How-Ming Shieh
口試委員:
學位類別: 碩士
Master
系所名稱: 管理學院 - 資訊管理學系
Department of Information Management
畢業學年度: 90
語文別: 中文
論文頁數: 56
中文關鍵詞: 資料挖掘關連規則多屬性序列式資料不連續序列
外文關鍵詞: Data Mining
相關次數: 點閱:14下載:0
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 資料挖掘是在資料庫中找尋時常發生的既定規則,利用資料挖掘的技術,可以在大量的交易資料中挖掘出有趣的規則或是特性,這些規則或是特性可以提供我們做為決策參考之用。
    以往在多屬性序列式資料的研究中,僅在挖掘具有連續性的序列樣式,對於不連續的序列樣式並無太多的論述。而本論文以LSS演算法為基礎,發展出適合多屬性序列式資料的DSS(Discontinuous Set of Sequence)演算法,並且改善了LSS演算法不能挖掘出不連續序列的特性。此演算法利用模糊集合的概念,將具有連續性的數值屬性轉換適合的語意,再利用DSS演算法的區間搜尋的方式,使得其不但可以找出連續性的序列樣式,也可以找出不連續的序列樣式,最後利用股市的資料來驗證此演算法的可行性。


    第一章 緒論 1 第一節 研究動機 1 第二節 研究目的 2 第三節 研究範圍 3 第四節 論文架構 3 第二章 文獻回顧 5 第一節 資料挖掘 5 第一小節 挖掘關聯規則 6 第二小節 資料歸納法 9 第三小節 序列資料挖掘 14 第二節 多屬性序列式資料 15 第三節 模糊集合 16 第四節 股價分析法 21 第三章 多屬性序列式資料結構 23 第一節 原始資料 23 第二節 屬性值切割 25 第四章 演算法 32 第一節 門檻值定義 32 第二節 序列集合 33 第三節 DSS演算法 34 第四節 推導後的關聯規則型式 37 第五章 系統實驗 40 第一節 系統介紹 40 第二節 系統介面 41 第三節 產生序列樣式 42 第四節 規則檢驗 46 第六章 結論與建議 54 第一節 結論與貢獻 54 第二節 未來研究方向與建議 55 參考文獻 56 表1-1 某序列樣式 2 表2-1 Database D 7 表2-2 pass1 C1與L1 7 表2-3 pass2 C2與L2 8 表2-4 pass 3 C3與L3 8 表2-5 原始資料表, 資料來源[7] 11 表2-6 過濾Graduate屬性, 資料來源[7] 12 表2-7 移除屬性Name, 資料來源[7] 12 表2-8 累加vote值, 資料來源[7] 13 表2-9 資料來源[7] 13 表2-10 資料來源[25] 18 表2-11 資料來源[24] 22 表3-1 各指標的語意 26 表3-2 某上市公司之股市原始資料 29 表3-3 轉換成技術指標 30 表3-4 轉換成語意變數 31 表4-1 1B1C1G 38 表4-2 1B1C1G®1D 38 表4-3 1B1C1G 38 表4-4 1B1C1G®1D 39 表5-1 計算出所有的類別支持度 42 表5-2 去除掉未過門檻值的類別 43 表5-3 第一回合的(L1) 44 表5-4 第三回的候選序列 45 表5-5 某公司的關聯規則 47 表5-6 訓練資料中出現1Y的次數分布 47 表5-7 測試資料中出現1Y的次數分布 48 表5-8 卡方齊一性檢定 48 表5-9 A公司序列為5的關聯規則 49 表5-10 B公司序列為5的關聯規則 49 表5-11 C公司序列為5的關聯規則 49 表5-12 A公司的序列 50 表5-13 B公司的序列樣式 51 表5-14 B公司的序列樣式(續) 52 表5-15 C公司的序列樣式 53 圖2-1 Apriori 演算法 7 圖2-2 屬性City 的概念階層 10 圖2-3 某大學學生的原始概念階層, 資料來源[7] 11 圖2-4 電流的明確集合 17 圖2-5 體溫的模糊集合 18 圖2-6 以明確集合與模糊集合分別定義“天氣舒適度” 19 圖2-7 四種標準歸屬函數 資料來源[13] 20 圖2-8 天氣舒適度的標準歸屬函數 20 圖3-1 相對強弱指標 26 圖3-2 心理線 27 圖3-3 乖離率 27 圖3-4 買賣氣勢指標 28 圖3-5 量強弱指標 28 圖4-1 L1 JION L1 33 圖4-2 DSS演算法 36 圖5-1 系統流程 40 圖5-2 系統主畫面 41

    參考文獻
    [1] R. Agrawal and R. Srikant, “Fast Algorithms for Mining Association Rules,” Proc. of the 20th Int''l Conference on Very Large Databases, Santiago, Chile, Sept. 1994.
    [2] R. Agrawal, T. Imielinski, and A. Swami, “Mining association rules between sets of items in large database,” SIGMOD 93, pp. 207-216.
    [3] M. -S. Chen, J. Han, and P. S. Yu , “Data Mining:An Overview from a Database Perspective,” IEEE Transactions on Knowledge and Data Engineering, vol.8 , no. 6,1996, pp. 866-883.
    [4] R. Agrawal, T. Imielinski, and A. Swami, “Mining association rules between sets of items in large database,” SIGMOD 93, pp. 207-216.
    [5] J. C. Bezdek, “Pattern Recognition with Fuzzy Objective Function Algorithms,” Plenum, New York, 1981.
    [6] R. Agrawal and R. Srikant, “Fast Algorithms for Mining Association Rules,” Proc. of the 20th Int''l Conference on Very Large Databases, Santiago, Chile, Sept. 1994.
    [7] Y. Cai, N. Cercone, and J. Han, “Attribute-Oriented Induction in Relational Databases,” Knowledge Discovery in Databases ,Ch 12, AAAI/MIT Press,1991.
    [8]Jiawei Han, Micheline Kamber, “Data Mining: Concepts and Techniques,”2001.
    [9] R. Srikant, R. Agrawal, “Mining Generalized Association Rules,” Proc. 21st VLDB Conf. Zurich, Swizerland, 1995.
    [10] R. Agrawal and R. Srikant, “Mining Sequential Patterns,” Proc. of the Int''l Conference on Data Engineering (ICDE), Taipei, Taiwan, March 1995.
    [11] V. Harinarayan, J. D. Ullman, and A. Rajaraman, “Implementing Data Cubes Efficiently,” Proc. 1996 ACM SIGMOD Int’l Conf. Management Data, pp.205-216, Montreal, Canada, June 1996.
    [12] J. Han,J. Pei, and Y.Yin, “Mining Frequent Patterns without Candidate Generation,”Proc.2000 ACM-SIGMOD Int. Conf. On Management of Data(SIGMOD’00), Dallas,TX, May 2000 .
    [13] Timothy J. Ross, “Fuzzy logic with engineering application,” International Edition, 1995.
    [14] L. A . Zadech, ”Fuzzy Sets,” Information and Controal, 8 ,1965.
    [15]Ada Wai-chee Fu, Man Hon Wong, Siu Chun Sze, Wai Chiu Wong, Wai Lun Wong, and Wing Kwan Yu, “Finding Fuzzy Sets for the Mining of Fuzzy Association Rules for Numerical Attributes,” Department of Computer Science and Engineering, Chinese University of Hong Kong.
    [16]J. Shu Yue, E.Tsang, D Yeung and Daming Shi, “Mining fuzzy associaton rules with weighted items,”2000 IEEE International Conference on Systems, Man and Cybernetics, 3:1906-1911, 2000.
    [17] Robert H. Golan, Wojciech Ziarko, “A Mothodology for Stock Market Analysis utilizing Rough Set Theory”, IEEE.
    [18] Gary, Jim, Adam Bosworth, Andrew Layman and Hamid Pirahesh, “Data Cube: A Relational Aggregation Operator Generalizing Group-By, Cross-Tab, and Sub-Totals,” IEEE 1996.
    [19]C.Bettini,X. S. Wang, S. Jajodia, J.-L. Lin, “Discovering frequent event patterns with multiple granularities in time sequences,” IEEE Trans. On Knowledge and Data Engineering, Volume: 10 Issue :2, 1998 ,pp. 222-237.
    [20]George H. John,Stanford University and IBM Peter Miller,Lockhead Martin Corporation Randy Kerber, “Stock Selection Using Rule Induction,” IEEE, 1996.
    [21]Agrawal, R., Faloutsos, C. and Swami, A. “Efficient Similarity Search in Sequence Databases,” Lecture Notes in Computer Science 730, Springer Verlag, 1993, pp. 69-84.
    [22]Chen, M-S., Park, J-S. and Yu, P.S. “Efficient Data Mining for Path Traversal Patterns,''” IEEE Trans. on Knowledge and Data Engineering, Vol. 10, No. 2, April 1998, pp. 209-221.
    [23]陳智宗,(言午)秉瑜,陳振明, “以資料挖礦法挖掘多屬性序列式資料規則之研究,” 中央大學資訊管理研究所碩士論文, 民89.
    [24]陳柏翰,(言午)秉瑜, 陳振明, “以RSS演算法挖掘股市交易資料之研究,” 中央大學資訊管理研究所碩士論文, 民90.
    [25]范揚明, 吳憲忠, “模糊理論在股市投資決策上的應用,”暨南大學資訊管理研究所碩士論文, 民90.
    [26] 陳仕昇,(言午)秉瑜, 陳彥良, “以可重複序列挖掘網路瀏覽規則之研究,” 資管評論第九期, 民88.
    [27](言午)長裕 何靖遠,”多維度跨界性資料挖掘-以股市為例,” 中央大學資訊管理研究所碩士論文, 民89.
    [28]沈清正, 陳仕昇, 高鴻斌, 張元哲, 陳家仁, 黃琮盛, 陳彥良, “資料間隱含關係的挖掘與展望,”中央大學 資訊管理系.
    [29]杜金龍, “技術指標在台灣股市應用的訣竅,” 金錢文化, 民87.

    QR CODE
    :::