跳到主要內容

簡易檢索 / 詳目顯示

研究生: 蔡榕恒
TSAI, JUNG-HENG
論文名稱: 雲端運算在醣基蛋白質體學量化分析之研究
The Study of Cloud Computing Used in Quantitative Analyzing in Glycoproteomics
指導教授: 陳彥文
口試委員:
學位類別: 碩士
Master
系所名稱: 資訊電機學院 - 通訊工程學系
Department of Communication Engineering
論文出版年: 2013
畢業學年度: 101
語文別: 中文
論文頁數: 43
中文關鍵詞: 雲端運算MapReduce蛋白質體學醣基蛋白質體學質譜分析
外文關鍵詞: Cloud Computing, MapReduce, Proteomics, Glycoproteomics, Mass Spectrometry
相關次數: 點閱:13下載:0
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 近年來隨著生物科技蓬勃發展,蛋白質的研究一直是生物科技的重點之一,加上質譜技術日漸進步,分析蛋白質中各個胺基酸組成以及其各種諸如醣化、磷酸化修飾等變得更簡易。然而就算實驗時僅針對單一蛋白質,質譜儀所輸出的數據量仍舊龐大,以人工判讀方式往往需花上近半年之久。本論文將針對一種採用水解酵素消化蛋白質為胜肽並搭配化學消去法產生斷醣訊號實驗,目的為找出O醣修飾胺基酸及O醣種類,對於實驗樣品經過質譜儀所輸出的資料做初步過濾篩檢,使資料量由數以千計減少為數十筆資料。此外,為了加速運算時間,本研究將資料篩選與檢測的程式利用雲端運算中的Hadoop架構所提供的MapReduce運算模式,將資料處理過程分散處理,降低運算時耗費的時間成本,讓醣蛋白質的鑑定得以從數個月大幅縮短為數天完成。


    With the rapid development of biotechnology in recent years, the analysis of amino acid composition in protein such as glycosylation, phosphorylation, etc. has become easier due to mass spectrometry techniques. However, the amount of data output from mass spectrometer is large and substantial even if it in single protein experiments. In such situation, manual interpretation often costs nearly a half year. This paper will focus on finding O-glycopeptides and the O-glycoform modified on glycopeptide in protein-digesting hydrolysis enzyme with β-elimination method which produce peptidebackbone-18 signals in experimental sample data outputted through the mass spectrometer and doing preliminary filter, which can deduce the amount of data into dozens. In addition, to accelerate the computation time, we develop a cloud computing architecture that provides Hadoop MapReduce computing model. This kind of distributed computing reduce operational costs in time-consuming, so the time of finishing identification of glycoprotein would be shortened from several months into several days.

    摘要 i ABSTRACT ii 致謝 iii 目錄 iv 圖目錄 vi 表目錄 vii 第一章 緒論 1 1-1 研究背景與動機 1 1-1-1 蛋白質體學與醣基蛋白質體學 1 1-1-2 質譜分析法 1 1-1-3 蛋白質體學與資訊軟體整合 2 1-1-4 雲端運算 2 1-1-5 研究動機 5 1-2 研究目標 5 1-3 研究方法 6 第二章 O醣鑑定實驗方法與說明 8 2-1 O醣鑑定與分析方法 8 2-2 實驗方法 10 第三章 軟體分析流程與雲端架構 15 3-1 質譜儀資料格式介紹 15 3-2 軟體流程設計 17 3-3 雲端運算 21 3-3-1 Hadoop介紹 21 3-3-2 MapReduce與HDFS 22 3-3-3 Hadoop與生物資訊 23 3-3-4 利用MapReduce及HDFS架構搜尋含醣訊號 23 第四章 結果分析與討論 26 4-1 實作環境介紹 26 4-2 資料分析與結果 27 4-3 雲端效能分析 29 第五章 結論 30 參考資料與文獻 31

    [1] Michael Armbrust, et al. “A view of cloud computing”, Communications of the ACM, Vol 53, pp. 50-58, April 2010.
    [2] Peter Mell and Timothy Grance, “The NIST Definition of Cloud Computing”, NIST Special Publication 800-145.
    [3] Ronald C Taylor, “An overview of the Hadoop/MapReduce/Hbase framework and its current applications in bioinformatics”, Bioinformatics Open Source Conference, 2010.
    [4] David C. Dallas,William F. Martin, Serenus Hua and J. Bruce German, “Automated glycopeptideanalysis review of current state and future directions”, Briefings in Bioinformatics Advance Access, Jul 2012.
    [5] Apache Hadoop project. (a). Hadoop MapReduce.
    [6] Apache Hadoop project. (b). HBase.
    [7] Apache Hadoop project. (c). HDFS.
    [8] 王鵬,雲端運算的關鍵技術與應用實例,佳魁資訊,民國九十九年。
    [9] 林榮耀等著,後基因體時代之生物技術,醫藥基因生物技術 教學資源中心主編,民國九十二年。
    [10] 黃莉娟,「利用化學消去方法搭配高解析質譜儀 以鑑定醣蛋白上O醣基化位置與其相對應的醣基種類」,碩士論文,101年6月。

    QR CODE
    :::