2024-04-03
一、新增6大數據庫!拓展宏基因組數據分析!
BacMet(antibacterial biocide and metal resistance genes database) BacMet數據庫全稱為抗菌殺菌劑與金屬抗性基因數據庫。數據庫包含了抗金屬離子的基因(metal resistance genes, MRGs)和抗殺菌劑的基因(biocide resistance genes, BRGs)兩大類,共計753個基因。 ARDB(Antibiotic resistance genes database) 抗生素的過度使用以及隨之而來的殘留抗生素對環境的污染,使得耐藥基因 (antibiotic resistance genes,ARG) 相關信息受到關注。ARDB是最早的耐藥基因數據庫,除此之外,整合ARDB數據庫的CARD數據庫,也已納入派森諾宏基因組/宏轉錄組標準交付結果中。 MGE(MobileGeneticElements) MGE是一個可移動元件參考基因數據庫。它包含了278個不同的基因和超過2000條參考序列,涵蓋了各種可移動基因元件(Mobile genetic elements,MGEs)。與利用CARD/ARDB數據庫獲得的耐藥基因(ARG)、BacMet數據庫獲得金屬抗性基因(MRGs)和抗殺菌劑的基因(BRGs),可以進一步研究耐藥基因,金屬抗性基因,可移動元件三者之間的關系。 TCDB(Transporter Classification Database) TCDB轉運蛋白分類數據庫是生物化學和分子生物學國際聯盟(IUBMB)批準用于膜轉運蛋白,包括離子通道的分類(TC)系統。TC系統類似于酶分類系統(EC系統),不同之處在于它同時包含了功能和系統發育信息,提供了1920個轉運蛋白家族的注釋,TC編號等。 Probio Probio益生菌數據庫,提供了448個已經上市的益生菌菌株的功能及綜合信息;167個進行過臨床試驗/現場試驗、382個有研究報道。不僅涵蓋了人類益生菌,還包括了動物和植物相關的益生菌的數據。可用于探究環境和醫學領域的益生菌信息。 QS(Quorum sensing) 細菌群體感應(Quorum sensing,QS)作為細菌進行信息交流和相互作用的最常用手段,具有廣泛性、特異性和調控性等特點。QS廣泛存在于人體微生物群、土壤等生態系統中,并潛在地影響著生物體/環境中微生物群的組裝過程。
二、新增三大分析內容!助力宏基因組結果深度挖掘! 全新差異基因富集分析! 富集分析的目標是驗證數據中觀察到的差異目標基因是否在特定的功能或通路中顯著富集。除了差異基因火山圖/Venn圖、富集分析氣泡圖/柱狀圖/網絡圖以外,新鮮的圈圖也強勢加入! 差異基因火山圖 富集分析圈圖 富集分析網絡圖 全新隨機森林ROC分析! 隨機森林是一種基于決策樹 (Decision tree) 的經典高效的機器學習算法,近幾年已有研究證明這一算法能夠對微生物群落樣本進行有效且準確的分類。受試者工作特征曲線(ROC)是以真陽性率為縱坐標,假陽性率為橫坐標繪制的曲線。ROC分析常用來驗證構建預測模型的準確性,常配合驗證隨機森林分析構建的環境預測模型使用。 隨機森林分析 ROC分析 全新菌群分型分析! 菌群分型分析可以幫助我們深入了解不同環境樣本中微生物群落的組成和結構,主要通過統計聚類的方法研究不同樣本優勢菌群結構的分型情況。通過該分析,可以將優勢菌群結構近似的不同樣本聚為一類,主要適用于特定環境樣本的菌群分型。常見的菌群分型可視化方法包含BCA(Between-class analysis)和PCoA(Principal coordinates analysis)。 Calinski-Harabasz (CH): BCA和PCoA: 菌群分型之間差異微生物分析:
本次升級后的宏基因組分析流程如下: