丁琛研究員團隊合作建立國際首個一站式蛋白質組數據分析雲係統Firmiana

發布時間:2017-05-10瀏覽次數:1933

      隨著蛋白質組學的飛速發展,其在生命科學和生物醫藥領域的重要作用和應用前景已經日益明晰。由此產生出的海量蛋白質組數據為蛋白質組解析和分析提出了更高的要求。然而,當今領域內蛋白質組產出大數據的實時、全麵分析和知識挖掘能力成為了製約蛋白質組技術應用的瓶頸。遺憾的是,目前尚無平台能夠完成從質譜原始文件收集、數據處理、生物信息學分析、知識挖掘的一站式綜合分析。5月9日,國家蛋白質科學中心(北京)秦鈞教授課題組、華東師範大學石鐵流教授課題組、狗万外围充值 丁琛教授課題組聯合在Nature Biotechnology雜誌上發表了題為“Firmiana: towards a one-stop proteomic cloud platform for data processing and analysis”的文章,建立國際首個一站式蛋白質組數據分析雲係統Firmiana(梧桐樹),大大方便了無生物信息學基礎的科研人員也可以無障礙的使用

 

     Firmiana支持包括來自Thermo,AB Sciex,Agilent等不同廠商的質譜原始數據格式,整合了多種現有的蛋白質組學分析工具(ProteoWizard,Mascot,X!Tandem,InterProphet等等),開發了多種定量和質量控製算法,並提供了多種生物信息學分析(聚類分析,差異蛋白分析,通路富集分析等)以及數據挖掘功能。為了驗證Firmiana平台數據處理的能力,研究人員測試了1.5TB(約2000個原始文件)的數據集,進行了全局質量控製並在短內完成處理。Firmiana平台所提供的數十種在線的生物信息學工具有很好的兼容性、持續可開發性和易用性,無生物信息學基礎的科研人員也可以無障礙的使用。截止到2017年5月10日,Firmiana已存儲並處理了來自十一個物種的3282份實驗的數據。

       為了進一步提升Firmiana的數據存儲、數據處理、知識挖掘能力,在目前推出的Firmiana 1.0版本基礎上,研究人員正將Firmiana移植到超算係統上(Firmiana 1.5)。經測試,在超算係統上運行的Frmiana可提升兩百倍的分析速度。科研人員分別在北京和上海的超算上建立了主站和鏡像備份係統,確保數據的安全和高效分析。

      據悉,秦鈞教授,石鐵流教授,丁琛教授為本文的通訊作者。博士生馮晉文、裘乃麒、倪曉天、占冬冬為本文共同第一作者。

 

Baidu
map