蛋白質:人工智能破解生物學最大謎團之一的意義所在

聽新聞

▲DeepMind預測的軍團菌病細菌的蛋白質模型。(圖/CASP/DEEPMIND/VTAGLIABRACCIDTOMCHICK,UT SOUTHWESTE)

半個世紀以來,預測一種蛋白質如何折疊成其特有的三維形狀一直困惑著科學家,也是生物學的重大挑戰之一。

但專家們宣佈,這個生物界最大謎團之一現在基本上已經被人工智能AI破解。

總部在倫敦的英國人工智能公司DeepMind(深度思考)稱,他們「基本上解開了這一難題」。

更好地理解和預測蛋白質形狀對未來新藥的開發起到關鍵作用。谷歌旗下的DeepMind所取得的科技進步預期有望加速對包括新冠在內等一系列疾病的研究。

一些來自美國的獨立科學家表示,DeepMind系統對蛋白質形狀預測的凖確性可以跟那些昂貴和耗時的實驗室方法相媲美。

加利福尼亞大學戴維斯分校的克雷什塔夫維奇博士(Andriy Kryshtafovych)是科學評審團成員之一,他形容DeepMind取得的這一成就「非常出色」。

克雷什塔夫維奇博士表示,快速和凖確地弄清蛋白質的形狀有著徹底改變生命科學的潛能。

什麼是蛋白質形狀?

電腦上顯示的是與受體相結合的蛋白質
Getty Images
電腦上顯示的是與受體相結合的蛋白質

蛋白質存在於所有生物體中,是細胞生存的基礎。它們在生命必不可少的化學過程中發揮著核心作用。

蛋白質由氨基酸按一定順序結合形成的多肽鏈組成,它們以無數方式折疊成各種精緻形狀,而這是它們在身體中發揮重要角色的關鍵所在。

許多疾病都與蛋白質所扮演的角色有關,比如,它們可以成為催發化學反應的酵素、抗擊疾病的抗體或是作為化學信使的荷爾蒙胰島素等。

美國馬里蘭大學的莫爾特博士(Dr John Moult)是科學評審團的主席。他解釋說,這些蛋白質分子哪怕是微小的重新組合排列都會對人們的健康產生災難性的影響。因此,要了解疾病和找到新治療手段就要研究蛋白質。

莫爾特進一步解釋,僅人類蛋白質就有成千上萬種,其他物種的蛋白質更是多達幾十億,包括細菌和病毒的蛋白質。而目前人類只是試圖破解一種蛋白質的形狀就需要數年的時間和昂貴的儀器設備。

預測競賽

1972年,美國生物學家克里斯蒂安·安芬森(Christian Anfinsen)曾因為對氨基酸序列與生物活性構象之間關聯的研究獲得諾貝爾獎。

安芬森認為,應該有可能根據蛋白質的組成成份氨基酸的序列來確定蛋白質的形狀。

自那以後,每兩年全球20多個國家的幾十個研究團隊都會嘗試讓電腦通過氨基酸序列來預測大約100種蛋白質的形狀。

與此同時,生物學家們在實驗室中則使用諸如X射線晶體學(X-ray crystallography) 和核磁共振光譜法( NMR spectroscopy)這樣的傳統技術確定蛋白質的三維結構,以了解蛋白質分子中每一原子的相對位置。

之後,由科學家組成的專門CASP小組(相當於全球蛋白質結構預測競賽評審團,the Community Wide Experiment on the Critical Assessment of Techniques for Protein Structure Prediction) 對這些團隊用電腦所預測的蛋白質三維結構與使用實驗室方法得出的三維結構結果進行比較。

CASP評審小組使用從0-100的測量方法對各團隊預測結果的凖確性進行對比。 DeepMind的人工智能AlphaFold獲得了90分,與實驗室預測結果相當。

AI學習速度驚人

新冠病毒
Getty Images
新冠病毒獨特的刺突蛋白質(紅色部分)

在最新一輪預測結果中(Casp-14),AlphaFold所預測的三分之二蛋白質形狀凖確性與實驗室結果一致,另外一些預測結果雖然得分也很高,但凖確性沒有達到相同水平。

AlphaFold使用深度學習算法,來學習和研究全球數據庫中所保存的已知蛋白質的三維形狀。這些折疊蛋白質的結構以空間圖的方式呈現。

BBC科學事務記者布里格斯(Helen Briggs)表示, AI的學習速度驚人,它用幾天的時間就能達到實驗室幾十年的研究水平。

用途和意義

明確蛋白質的三維結構對開發新藥以及了解包括癌症、失智症以及傳染性疾病至關重要。

以新冠為例,科學家一直在試圖研究新冠病毒表面的刺突蛋白是如何與人類細胞中的受體相互作用的。

倫敦大學學院的馬丁教授告訴BBC記者,了解蛋白質序列如何折疊成三維形狀其實是生物學最基本的問題之一。他解釋說,蛋白質的功能完全取決於它的三維結構形狀,而蛋白質功能則關係著我們健康與疾病的一切。

因此,了解了蛋白質的三維結構有助於人們設計新藥、防治疾病,無論是遺傳疾病還是感染疾病。

生物學最大謎團之一

歐洲生物信息研究所桑頓教授(Prof Dame Janet Thornton)表示,蛋白質折疊成獨一無二的美麗三維結構堪稱是生物學上最大的謎團之一。

她解釋說,如果能更好地了解和預測蛋白質結構就意味著人類將能更好地了解生命、進化以及疾病和健康等問題。

接下來,更多的科學家希望能檢測這些數據以確定AI方法到底有多凖確、多細緻。

目前,人類對蛋白質的知識仍存在缺口,包括多種蛋白質是如何組合到一起的,以及蛋白質如何與其他分子,例如脫氧核糖核酸(DNA)和核糖核酸(RNA)相互互動。

克雷什塔夫維奇博士表示,現在基本上解決了單一蛋白質的結構問題。它為未來找到蛋白質復合體結構形狀的新方法打開了一道大門。正是這些眾多蛋白質復合體的共同作用才形成了生命的主要機制以及其他功能。

蛋白質 人工智能 生物學 謎團
廣告 / 請繼續往下閱讀
東森新聞 51 頻道 24 小時線上直播|Taiwan EBC 24h live news
東森新聞 51 頻道 24 小時線上直播|Taiwan EBC 24h live news

東森新聞 51 頻道 24 小時線上直播|Taiwan EBC 24h live news

朝野開戰Live/防選罷法三讀!綠委破窗佔立法院議場

朝野開戰Live/防選罷法三讀!綠委破窗佔立法院議場