| 研究生: |
邵莉雅 Li-Ya Shao |
|---|---|
| 論文名稱: |
龐大資料集之線性迴歸分析 Linear regression for large data base. |
| 指導教授: |
樊采虹
Tsai-Hung Fan |
| 口試委員: | |
| 學位類別: |
碩士 Master |
| 系所名稱: |
理學院 - 統計研究所 Graduate Institute of Statistics |
| 畢業學年度: | 91 |
| 語文別: | 中文 |
| 論文頁數: | 38 |
| 中文關鍵詞: | 龐大資料集 、迴歸 、資料挖掘 |
| 外文關鍵詞: | Large data base, Data Mining, regression |
| 相關次數: | 點閱:8 下載:0 |
| 分享至: |
| 查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報 |
隨著科技的進步,各行各業的資料可能數以”億”計。但在極大集資料分析上,受計算工具儲存容量的限制,使得傳統的方法不可行。本文提出分段加權最小平方法來取代傳統的迴歸方法。我們將資料予以分組,先在各區段中估計迴歸係數,再將各段迴歸係數估計量的變異數加入考慮,使得較大變異區段之估計量具有較小的權重,進而探討估計量之性質。另外並提出一檢定迴歸係數之分段檢定法以及切斷分割原理和選擇變數的方法。
Many classical methods are not used for large data base . This paper is base on the statistic point to analysis the large data base . We prefer three regression methods to analysis data of large data base.
2. Chao, M. T. and Lin, G. D. (1993). The Asymptotic Distributions of the Remedians. Journal of Statistical Planning and Inference, 37, 1-11.
3. Draper, N. R. , Smith, H. (1998). Applied Regression Analysis 3nd Ed.
Wiley, New York .
4. Hand, D. J., Blunt, G., Kelly, M. G. and Adams, N. M. (2000). Data
mining for Fun and Profit. Statistical Sciences, 15, 111-131.
5. Hand, D. J. (1998). Data mining : Statistics and more ? .American Statistician, 52, 112-119.
6. Hurley, C. and Modarres, R. (1995).Low-storage quantile estimation. Computational Statistics, 10, 311-325.
7. Neter, J., Kutner, M. H., Nachtsheim, C. J. and Wasserman W. (1996). Applied Linear Regression Models, 3rd ED, Richard D. Irwin, Burr Ridge,Illinois.
8. 林共進和林億雄(2001)。 龐大資料集的統計推論方法。成功大學統計學報,第二十四期,68-84。
9. 馬瀰嘉、蘇佩芳和林共進(2001)。資料探勘-超大型資料庫基本統計量的計量。成功大學統計學報,第二十四期,85-99。
10.任眉眉、林億雄和林共進(2002)。龐大資料集之簡單線性迴歸分析。Manuscript 。