手機版 | 網(wǎng)站導航
觀察家網(wǎng) 科技 >

俄生物學家開發(fā)一種算法可識別與疾病相關基因

科技日報 | 2020-12-03 09:18:08

俄羅斯圣光機大學(ITMO)生物信息學研究人員開發(fā)了一種算法,可幫助評估基因對人體過程(包括疾病發(fā)展)的影響。這項研究發(fā)表在《BMC生物信息學》上。

脫發(fā)、肥胖或視力低下可能與特定基因有關,識別出相關基因組,有利于研究和治療。此外,為確定基因和病情之間是否存在聯(lián)系,了解基因之間的相互作用也非常重要。

ITMO助理教授愛列克謝·謝爾蓋西切夫解釋說:“總的來說,每個人有超過2萬個基因。通過將患者病情相關基因與健康人的基因進行比較,我們可以看到二者之間活性和表現(xiàn)形式的差異?;诖诵畔ⅲ梢詣?chuàng)建一個共同的圖示,顯示所有基因之間的相互聯(lián)系,并且每個基因都被分配一個權重因子。通常,科學家們只繼續(xù)研究最活躍的基因,對其進行特殊的子圖繪制,但是將這些基因從‘普通背景’中分離出來,就失去了評估每個基因與其他基因的關聯(lián)性進而進行診斷的機會。”

在新研究中,研究人員不僅專注于權重因子最高的那個基因系統(tǒng),還提出了一種新方法,可利用整個基因組上的數(shù)據(jù)生成數(shù)十萬個子圖。該算法基于馬爾可夫鏈蒙特卡羅方法,可計算每個樣本與所討論病情之間的聯(lián)系概率,并就每個基因之間的相互作用分析樣本的組成。

研究人員從一組基因中刪除一個基因,如果活躍基因的數(shù)量增加,則表示正確并保存結果。否則就重新開始。通過一系列步驟,權重因子開始快速增長。這樣一來,該算法就可以生成大量圖形。

有了這樣一個樣本組,研究人員就可發(fā)現(xiàn)比其他基因更頻繁出現(xiàn)的基因。如果一個基因出現(xiàn)在90%的此類子圖中,那么就可90%地確定該基因與相關疾病的關系。

該項目研究人員指出,這一算法未來可表示為帶有滑動條的程序,允許用戶出于各種目的以各種置信度生成結果。例如,置信度水平越低,顯示的基因就越多,反之亦然。如果僅需要確定信任的基因,可以將置信度水平設置為約99%。

  • 標簽:基因,算法

媒體焦點