當蛋白質組遇上AI,加速的是什麽
■記者 溫才妃
一個(ge) 普通人做一次血液全蛋白質組的質譜檢測,能獲得哪些有意義(yi) 或有趣的信息?誰會(hui) 成為(wei) 蛋白組領域的23andMe(DNA鑒定公司)?
去年7月,當人類蛋白質組98.5%的蛋白質結構被AlphaFold算法破譯時,就有不少網友在知乎提出了這一問題。還有一些投資者幹脆直接詢問上市公司,是否有涉及人工智能(AI)在生命科學領域的發展計劃和技術儲(chu) 備。
雖然蛋白質組學研究並非新鮮概念,但隨著AI技術的突破,蛋白質組學相關(guan) 應用開發與(yu) 市場化正在快速發酵。
今年年初,人工智能蛋白質組診斷服務提供商西湖歐米(杭州)生物科技有限公司宣布完成數億(yi) 元Pre-A輪融資。他們(men) 開發的用於(yu) 甲狀腺結節診斷的臨(lin) 床實驗室自建項目(LDT)產(chan) 品,也問世在即。
蛋白質組學+AI,會(hui) 不會(hui) 是下一個(ge) 市場焦點?
新算法重塑蛋白質組學
有人調侃,蛋白質組學概念之所以在二級市場遇冷,首要原因是人們(men) 並不清楚它究竟是什麽(me) 。
但其實,它是開啟精準醫療的鑰匙。
電影《我不是藥神》中的神藥“格列衛”,其靶點就是一個(ge) 融合蛋白,通過藥物小分子抑製融合蛋白,最終控製慢性髓性白血病的發展。換句話說,誰更“懂”蛋白質,誰就能找到那把破解重大疾病、研發新藥的鑰匙。
然而,“傳(chuan) 統的蛋白質組學分析技術和方法,並不完全適合用來研究蛋白質係統,所缺乏的是對蛋白質進行定量數據積累的過程,而且沒有一個(ge) 合適的算法。”西湖大學特聘研究員、西湖歐米創始人郭天南說。
AlphaFold的出現讓科學界看到了曙光。
2021年7月,人工智能公司DeepMind和歐洲生物信息研究所合作,發布由AlphaFold預測的蛋白結構數據庫,完成了人類蛋白質組98.5%的蛋白質結構預測。這被認為(wei) 是本世紀最重要的科學突破之一。
隨後,DeepMind在《自然》公布了AlphaFold2的源代碼。AlphaFold2可在幾分鍾內(nei) 破譯一般蛋白質的三維結構,還能預測一個(ge) 由2180個(ge) 氨基酸相連的大蛋白質結構。
“在Alphafold2之前,AI技術一直沒有真正進入微觀的生命世界。但實際上,AI技術之於(yu) 微觀生命世界不僅(jin) 是一個(ge) 必要條件,也是一個(ge) 充分條件。”郭天南說。
如果沒有AI技術,人類的理解力不可能弄清如此多的蛋白質動態,因為(wei) 它實在太複雜了。“基因相對穩定,一個(ge) 人一輩子做一次基因測序就夠了,但蛋白質無時無刻不在發生變化,一場感冒都會(hui) 改變很多細胞、蛋白質。而精準醫學就是根據病人當前的情況,給他提供最合適的診斷和治療方法。有了蛋白質組學+AI,精準醫學將會(hui) 提高到另一個(ge) 層麵。”郭天南說。
AI助力催生精準醫療
十幾年前,郭天南在武漢協和醫院血液科學習(xi) 、工作。他清楚地記得,一盒格列衛30多萬(wan) 元,科室把它買(mai) 下來,一顆一顆賣給病人。後來,他遠赴瑞士蘇黎世聯邦理工學院,師從(cong) 蛋白質組學領域的開拓者之一Ruedi Aebersold。
2017年歸國後,他把高通量質譜技術帶到了西湖大學實驗室。簡而言之,這項技術就是給數以萬(wan) 計的蛋白質“測體(ti) 重”,通過精確到小數點後30位,去辨別A君、B君。要知道在微觀世界,蛋白質始終處於(yu) 變化之中,尚無任何技術可以通過分子表麵特征去做識別。而高通量質譜技術則可以給蛋白質的運動“拍電影”,當藥物進入細胞後,記錄蛋白質變化所產(chan) 生的大數據。
“質譜用於(yu) 記錄分子量,高通量則要求快,從(cong) 中推斷出它是什麽(me) 樣的蛋白質、有多少量。”郭天南告訴《中國科學報》。
精準醫療主要涉及診斷與(yu) 治療兩(liang) 方麵,西湖歐米在這兩(liang) 方麵均有布局。
甲狀腺結節是人群中的高發病,有30%的甲狀腺結節無法識別惡性、良性,很多病人在心理壓力之下挨了不必要的一刀,而失去甲狀腺的病人須終身服藥。西湖歐米將蛋白質組結合AI技術開發出的LDT產(chan) 品,能夠讓這30%的病人中的絕大部分避免挨刀。
郭天南還有一個(ge) “小目標”,就是通過研發成本降至1/10的LDT產(chan) 品,讓其成為(wei) 物美價(jia) 廉的診斷方法。
而更讓科學家與(yu) 市場興(xing) 奮的是,AI也賦予製藥更多想象空間。與(yu) 國內(nei) 不同,國外製藥公司非常重視開發新的藥物靶點,目前已發現的藥物靶點約有500個(ge) ,而約40%的藥物是以G蛋白偶聯受體(ti) 為(wei) 靶點發現和設計的。
在AI製藥中,高通量質譜技術是公認的實際使用中最有效的測量選擇。在郭天南看來,至少可以在兩(liang) 方麵入手:產(chan) 生與(yu) 製藥相關(guan) 的蛋白質數據,聯合AI模型,建立比藥物篩選更有效的新方法,促進新藥研發;建立一個(ge) 基於(yu) 蛋白質、大數據和AI技術的新藥物生產(chan) 與(yu) 質控流程,找到最佳藥物生產(chan) 方法。
目前,他正在同多個(ge) 國際製藥公司合作開發藥物靶點,並配合醫院、藥廠開展相關(guan) 製藥工作。
想象空間可能更大
對比二級市場尚未“顯山露水”,近年來,蛋白質組學在一級市場迎來了它的“小陽春”。
2020年,蛋白質工程服務商拜譜生物宣布完成千萬(wan) 級Pre-A輪融資;蛋白質組學技術服務及產(chan) 品銷售商中科新生命宣布完成2億(yi) 元A輪融資;蛋白質組學技術開發及應用商景傑生物宣布完成5.3億(yi) 元人民幣的B輪融資。
郭天南所在的西湖歐米於(yu) 1月13日宣布完成數億(yi) 元Pre-A輪融資。該輪融資由倚鋒資本和高瓴創投共同領投,高榕資本、冪方資本和西湖科創投跟投。去年西湖歐米已完成了天使輪和天使+輪融資。
如今,蛋白質組學方法被應用於(yu) 腎癌、肝癌、結直腸癌、肺癌、胃癌等癌症的臨(lin) 床研究和診治。科學家們(men) 紛紛表示,蛋白質組學驅動的精準醫學(PDPM)新時代已經到來。
高榕資本執行董事樂(le) 貝林告訴《中國科學報》,用蛋白質做診斷、藥物抗體(ti) 開發以及蛋白原料的公司此前受到資本青睞,它們(men) 分別代表了蛋白質在終端及原料中間體(ti) 的應用。與(yu) 此同時,布局蛋白質產(chan) 業(ye) 上遊端,比如全新發現的大數據端蛋白質組,近年來也備受關(guan) 注。
“以往,蛋白質組在樣本大小、類型以及單位樣本所產(chan) 生的數據量上有所限製。因此,我們(men) 更青睞在基礎數據方法學上有創新和獨到的技術,並能產(chan) 生高質量數據的公司。”樂(le) 貝林說。
掌握基礎方法學最核心的技術,可實現極小微量樣本蛋白質組的分析,擁有多樣化的臨(lin) 床樣本處理能力、獨到的數據分析解讀能力,以及醫學背景出身的郭天南是公司很好的“翻譯官”……這些都是西湖歐米被資本方看中的原因。
從(cong) 人類基因組計劃啟動到最近十年,境內(nei) 外湧現了一批上市公司,如華大基因、腫瘤NGS公司GRAIL、蛋白質組學公司SEER。“蛋白質組學理論上可以複製基因組在診斷上的路線,甚至走得更加深入。進一步看,蛋白質組學的應用從(cong) 診斷邁向治療,想象空間可能更大。”樂(le) 貝林說,這也是對郭天南在該階段嚐試AI製藥的信心和期待所在。
能否步入深水區,發現有代表性的藥物靶點,並把它做成全新的藥物,是科學家孜孜以求的目標。如中國科學院院士、軍(jun) 事醫學科學院院長賀福初在肝癌方向發現了很好的靶點,並在靶點上進行了藥物篩選。“下一步,蛋白質組學的技術積累能否在藥物的創新性研發上有所突破,我們(men) 拭目以待。”樂(le) 貝林說。
如果將視野再拓展一些,除了重大疾病之外,蛋白質與(yu) 生活中的慢病、代謝類疾病也有緊密關(guan) 係。與(yu) 蛋白質組學相結合的藥物、食品、保健品等終端產(chan) 品,均未來可期。
《中國科學報》 (2022-03-14 第4版 科創)
版權聲明:凡注明“來源:新利平台”或“新利平台文”的所有作品,版權歸高原(北京)文化傳(chuan) 播有限公司。任何媒體(ti) 轉載、摘編、引用,須注明來源新利平台和署著作者名,否則將追究相關(guan) 法律責任。