【物理好好玩S2EP02】生命的算計——2021年度科學突破

文、聲音|張嘉泓
(東方IC)

每一年的歲末,權威的Science科學雜誌會選出當年度科學最重要的發現,以及十大入圍名單。評選雖然免不了有主觀的想法,但這是很好一個機會,呈現最尖端科學研究的趨勢,比起諾貝爾獎都是頒給已經成熟的工作,其實更加有趣。

年輕真好,通常說這話的人都已不再年輕了。但與年輕人在一起也很好,所以我這幾年都教大一的普通物理。在第一節課我都會講三件事:首先,現在大家很流行重訓,鍛鍊肌肉、維持體態。但人類最大的優勢,其實是大腦。那為了維持這優勢,你不覺得,我們更應該積極作思考的重訓,來鍛鍊大腦、維持智力嗎?健身的重訓,是讓肌肉承受稍微超越它能力的負擔,作完後自然會覺得全身幾乎癱瘓。所以各位同學,如果你今天奮力聽完我講的相對論之後,覺得全身無力,腦筋一片空白,思考的重訓就成功了。

其次,我會告訴學生,現在作一個科學家,實在幸福。在這個時間點上,從生物、到物理、到天文,每一個科門,似乎都發展出了前所未有的精良工具,來擴展科學的視野,回答人類長久想問的問題。舉幾個最明顯的例子:粒子物理學家有了大強子對撞機,天文學家有了剛剛升空的韋伯太空望遠鏡,腦神經學家利用非常先進的顯像技術,來研究大腦與意識的關係。而且現在分子生物學有了人工智慧加持的計算能力,來對付生命最基本的問題。

每一年的歲末,權威的Science科學雜誌會選出當年度科學最重要的發現,以及十大入圍名單。評選雖然免不了有主觀的想法,但這是很好一個機會,呈現最尖端科學研究的趨勢,比起諾貝爾獎都是頒給已經成熟的工作,其實更加有趣。今年選出的最大突破就是人工智慧驅動的軟體,突破性地推進了蛋白質摺疊的計算與模擬。

一條黏度不太均勻的長膠帶

蛋白質是生物體最基本的運作單位,幾乎所有生命的功能都由它們負責。儘管蛋白質有各式各樣,但都由一串氨基酸所組成。氨基酸是一個有機化合物,如果把它放在一個平面上看,中央是一個碳原子,上下左右會各有一群原子,化學通常會用某某基來稱呼這些原子群。氨基酸中央碳原子的左邊,固定是一個氨基,右邊則是羧基。妙的是,左端的氨基,可以與另一個氨基酸右端的羧基,脫去一個水分子後,黏在一起。這第二個氨基酸的氨基,又可以如法泡製與下一個氨基酸的羧基相連。於是如積木一樣,一個卡住一個,組合成一條骨幹般的長鍊,這就是蛋白質了。而個別氨基酸中央碳原子的下方固定是氫,上方則可以有不同的側鏈分子,於是就形成了不一樣的氨基酸。

人類的氨基酸可以有二十種,長鏈是由哪些氨基酸組成,就形成一個序列。側鏈分子決定了氨基酸的化學性質,例如有的比較親水,有的比較喜歡與其他分子連結。所以,不同的氨基酸序列組合,就具有特定的化學性質,也就產生許多不同的蛋白質。一般而言,蛋白質長度大約在上百個到上千個的氨基酸序列,就如同一個由字母組成的句子,一個序列對應一個蛋白質。

蛋白質是在細胞中依據DNA的鹼基序列上不同的段落,組裝出來。完成後,蛋白質長鍊會很快折疊形成一個3D的形體。你可以想像一條黏度不太均勻的長膠帶,不小心粘黏在一起,裹成了一個奇形怪狀的球,唯一不同的是,一個蛋白質只會折疊成一個形狀。折疊後的外表形狀,以及外層原子群的化學特性,就決定了這個蛋白質的功能以及扮演的角色。包括肌肉的收縮、將食物轉化為細胞能量、在血液中運送氧氣、以至對抗外來入侵等等。原來看似複雜、神秘的生命,分解開來後是非常簡單、直接的。2001年諾貝爾醫學獎得主諾斯是這樣寫的:「在分子的層次,生物過程基本上可以簡化為已知的物理與化學的過程。」這無疑是二十世紀人類科學發現的巨大成就。

新冠病毒內有四種蛋白質

這一次疫情的新冠病毒,就是很好的例子。新冠病毒內有四種蛋白質,其中最重要的棘狀蛋白質S,就是由1273個氨基酸所組成,算是相當長的。折疊後就形成現在已惡名昭彰的病毒表面突起。棘蛋白氨基酸序列第一段,稱為S1,折疊後,就形成突起的頂冠,第二段的S2則形成下方連接病毒的骨幹。S1序列中間有一小段稱為連接區,原本縮在頂冠的表面下,但有時也會豎立起來。如果進入人體,這一連接區的形狀正好能抓住呼吸細胞上的受體。

接下來更神奇了:利用被害細胞自己提供,如剪刀的蛋白酶,S1與S2序列會在交界處斷開,S1分離改變了棘蛋白的序列,S2被釋放而改變形狀、重新折疊。上面有一段會伸長,如機器手臂,使S2靠近被害細胞,並露出一個負責侵入的融合段,黏上受害細胞的外膜。S2上另一段則會收縮將細胞與病毒拉近,像兩個碰撞的氣泡合成一個,細胞與病毒的外膜就連在一起,中間毫不設防了。接著,病毒內的RNA就開始堂而皇之的進到細胞內了。

如此複雜惡毒的攻略,竟全是透過演化,一步一步精進,而且分解開來,都是天然的過程。這時,真不知是不是要讚嘆大自然的鬼斧神工。

因此氨基酸序列決定了蛋白質折疊後的形狀,形狀則決定了功能。這個因果關係十分明顯,所以分子生物學的核心問題就是,如果給定一個蛋白質的氨基酸序列,我們能不能預測出它折疊後的形狀,這是一個長久以來科學家都想解決的問題。

如果一個一個試,需要用到整個宇宙年紀

蛋白質折疊後的形狀,是可以觀察的。標準的物理工具,稱為x射線結晶學。1950年代,科學家開始使用這個方法,觀察紀錄各種蛋白質的3D結構。大概十年前,低溫電子顯微鏡技術漸漸成熟,成為解讀蛋白質結構的主流工具,速度快,但儀器十分昂貴。這是一個非常耗時的工作,但慢工出細活,到今天蛋白質資料庫已經儲存了將近二十萬個蛋白質的3D圖像。

而要破解蛋白質折疊背後的原理,還要一點工夫,七零年代的工作證實了,氨基酸彼此的交互作用,就像上述長膠帶的不均勻黏度,負責將蛋白質拉成並固定於最終的形狀。原則並不複雜,但因為參與的原子數量龐大,可能的形狀更是天文數字。科學家估計,如果一個一個試,蛋白質需要整個宇宙年紀,才能把所有折疊可能都窮盡一次。當然真實的情況是,蛋白質一下子就找到它應該折疊的形狀,而且很少犯錯。

1970年代起,數值計算越來越快,科學家開始提出許多電腦模型,來嘗試解決蛋白質折疊問題。一開始,科學家只能對付很小的蛋白質。為了激發研究的動力,科學家開始組織年度競賽,來測試不同模型的預測能力。最初的成績並不是非常理想,以完全與實驗結果吻合為100分,平均成績一直低於60,基本上是不及格。

AlphaFold開始進軍蛋白質折疊問題

但科學家有兩張王牌,首先,兩個不同蛋白質,常常具有某些相同的氨基酸段落,這些段落通常會折疊成一樣的形狀。所以如果一個未知形狀,與已知形狀的蛋白質,有50%氨基酸序列相同,已知的蛋白質就可以提供一個很好的範本,來加速形狀的計算。

這與人一般的認知學習非常類似,我們對新事物的認識,總是基於已知的經驗,所以幽浮畫起來總是很像飛機。其次,氨基酸序列是演化的結果,但個別氨基酸並非單獨演化。當蛋白質中的一個氨基酸發生突變時,在折疊狀態,與它疊在附近的氨基酸很可能也會跟著變異。序列中的氨基酸,如同字母先組成了單字,整個字通常會一起演化,與折疊特徵也有直接的對應。

這些訣竅非常有用,到了2018年,科學家漸漸進步到70分。大突破來自人工智慧,剛剛介紹的絕招,都指向將人類的認知能力與模式,運用到這個問題上。2018年時,AlphaFold開始進軍蛋白質折疊問題。這是Google旗下的DeepMind公司的一個團隊,前幾年以人工智慧打敗圍棋棋王的AlphaGo團隊,就是屬於這個公司。AlphaFold的基本技巧,就是以現有已觀察確認的蛋白質結構資料庫,來訓練它的程式、讓它學習。

這兩個領先團隊都把他們的程式碼公布在網路上

如同人類學會一個語言,腦中有了這個語言的單字庫,一旦遇到沒看過的字,我們多少可以猜到一點邊。也就是讓機器模仿人類的認知,來加速了解。氨基酸序列並非隨機分布,而有一定樣式,因此特別適合。第一次AlphaFold的嘗試,就得到80分。在那時應該是破紀錄的。2020年進階的AlphaFold2 ,利用182個微處理器組成的網路,一舉達到90分,幾乎就等同於與實驗觀察完全一致了。

去年開始,以人工智慧驅動的軟體,來解決蛋白質折疊問題努力,進入爆發的階段。七月時華盛頓大學的RoseTTS-Fold團隊,解出了上百個與藥品有關的蛋白質結構。過了幾個星期,DeepMind公布他們已解出了35萬個人體內蛋白質的結構,這就佔了總數的44%。預期不久之後,他們的預測資料庫就會增加到橫跨物種、上億個蛋白質的結構,這幾乎是已知存在的所有蛋白質的一半數量。

令人佩服的是,這兩個領先團隊都把他們的程式碼公布在網路上,其他團隊可以很容易進入這個領域,結合整個社群的創意與能力,一起努力。例如中國的科學家就利用AlphaFold2,畫出了負責DNA的修復與基因表現、可以連接於DNA的兩百個蛋白質的結構。

堅持很重要,抓到時勢也很重要

當然科學家也利用AlphaFold2,來研究最近出現的Omicron變種,Omicron在棘蛋白出現了35個變異。其中在S1序列的許多變異,插入了較大的氨基酸,自然使得折疊後,冠狀體的形狀與原始的新冠病毒不同,因此感染後或疫苗產生的抗體,也就不太認得Omicron變種,使得免疫保護力變差。

當然還有許多工作還待完成,AI在預測時,還是有許多的技術限制。但正如雜誌編者的結語:「今年的這個突破,真的使得蛋白質結構、人人能作。讓我們得以仔細欣賞生命之舞,對生命得到了遠遠超越過去的深刻了解,這個精彩的演出,將永遠改變生物學及醫藥科學。」

在科學的研究中,古老的問題,常會因新的工具出現,而有突破性的發展,問題本身也隨時間不斷變化。今日的流行風潮,大都需要先埋沒幾十年,慢慢耕耘,而很有可能十年後就沒有人覺得重要了。因此,科學不是一成不變的追求,而是非常流動的。因此我最後告訴我的大一學生,科學家一定要有彈性、與靈敏的嗅覺,堅持很重要,抓到時勢也很重要。去年二月在節目中,介紹過BNT的執行長撒辛。他一直堅持對mRNA技術的熱情,但原來整個BNT公司,上千員工只有十幾個人是做疫苗相關研發,因為BNT的重心其實是癌症治療。2020年一月24日,撒辛自己說,是在餐廳與家人吃完固定的週末越南河粉晚餐後,從來沒有電視、也不看社群媒體的他,瀏覽到專業雜誌網站上,關於新冠肺炎病人的研究。撒辛很有智慧的跳脫了原來的想法,看出mRNA疫苗對新冠肺炎的疫情可以有所發揮,如果成功將可以拯救千萬人的生命。

這個智慧,正是好的科學家最重要的特徵。

下一次節目,我將繼續介紹年度科學突破的十大入圍名單,且讓我把它稱為「遍地開花、無所不用其極的科學創新」。

鏡週刊訂閱制上線,讓有價的閱聽成就更多優質文章,並獻上無廣告的閱讀環境,讓您盡情享受15類會員專屬內容,誠摯邀請您 立即加入

即日起加入年費會員,月月抽Sony旗艦機

更多內容,歡迎鏡週刊紙本雜誌鏡週刊數位訂閱了解內容授權資訊

月費、年費會員免費線上閱讀動態雜誌