AI能run出first in class新藥嗎?
激石Pepperstone(http://whhoupuyun.com/)報道:
2020年11月30日,人工智能程序AlphaFold2在蛋白質結構預測大賽CASP 14中,取得了與冷凍電鏡解析結果幾乎難以辨別的超高原子水平的精確度,引起藥物研發(fā)領域的廣泛關注,創(chuàng)業(yè)融資潮此起彼伏。全球也已經(jīng)有數(shù)十款AI參與研發(fā)的候選藥物進入臨床試驗,其中包括國內兩款AI在研產品ISM001-55(英矽智能)和XBI-302(未知君)。
國際上進展最快的禮來公司從加拿大溫哥華AI驅動的抗體發(fā)現(xiàn)公司AbCellera引進的COVID-19抗體巴尼韋單抗(bamlanivimab),在與從君實生物引進的JS016(埃特司韋單抗)聯(lián)用療法獲得FDA緊急授權(EUA)使用后,該聯(lián)用療法在2021年為禮來公司貢獻了超過22億美元的收入。AI驅動下run出first in class新藥似乎是毋庸置疑的。
來源:醫(yī)藥魔方NextPharma
目前國內主要是兩類不同背景的科研人員倡導借力AI研發(fā)藥物:一類是具有制藥工業(yè)CADD研發(fā)背景的,還有一撥是以IT技術見長的純互聯(lián)網(wǎng)背景。這兩撥創(chuàng)業(yè)者的優(yōu)勢和不足分別是什么?本文受訪者苗洪江博士因為偏愛生物學且希望用新技術和方法更好地解決科學問題,因此在PhD時期轉向了偏生物的計算算法開發(fā),后期又開始探索人工智能算法應用,圍繞蛋白質折疊問題研究了十多年。
苗洪江博士,天壤XLab負責人?
底層:數(shù)學+物理學
醫(yī)藥魔方:是因為什么樣的契機,讓您選擇了生物醫(yī)藥產業(yè)鏈上的細分領域?
苗洪江:中學時因為參加奧數(shù)競賽被新加坡維多利亞中學錄取,后來本科在英國學數(shù)學,畢業(yè)后大部分同學自然的選擇做了金融方向的工作,我因為偏愛生物學且希望用新技術和方法更好地解決科學問題,因此在PhD時期轉向了偏生物的計算算法開發(fā),后期又加入了人工智能算法應用。這里面除了基本的算法,也會用到蛋白分子間勢能計算等偏物理學方面或其它跨學科知識。
從PhD開始就一直圍繞著蛋白質折疊問題在研究,持續(xù)了十多年,期間也曾參與多個人類基因組學、遺傳代謝組學、蛋白質組學等生物計算項目,其中感受最深的可能要分幾個階段:從最初了解到蛋白質折疊是分子生物學研究的“圣杯”,到進入這個領域并逐漸嘗試解決折疊這一復雜過程中的“不合理”問題,并去嘗試解析這些結構。
到現(xiàn)在為止,做的已經(jīng)不僅僅是傳統(tǒng)意義上的融合生物計算與生物制藥,更是希望通過以AI計算能力為核心利器打破傳統(tǒng)藥物研發(fā)模式面臨的種種壁壘。其實做這一行的目的非常簡單,就是希望做正確的事情。既然那些正確又簡單的事情已經(jīng)被大家做的差不多了,那我們就嘗試做一些正確卻困難的事情好了,萬一成功了呢?這可能也是受到英國教育體系的高容錯率和提倡創(chuàng)新的影響。
醫(yī)藥魔方:從傳統(tǒng)視角,AI可能很難打破藥物研發(fā)模式面臨的各種壁壘。您對此怎么看?
苗洪江:行業(yè)當前有大量的未被解決的、甚至可以說是無藥可醫(yī)的疾病,特別近幾年大家經(jīng)常提到制藥領域遇到了low hanging fruit問題,比較容易開發(fā)的目標藥物基本已經(jīng)實現(xiàn),而剩下的眾多未被解決的疾病大多是機理未被解析或者成藥困難的。這就急需蛋白質從頭設計這一全新的技術手段來應對,目標是設計出具有預設功能但與天然蛋白質結構截然不同的蛋白質并推向實驗室驗證環(huán)節(jié)。
像AlphaFold2或者我們的TRFold2這類算法,通過計算模擬得到跟實驗室解析精確度相當?shù)牡鞍踪|結構預測結果,但時間和費用成本是原來的數(shù)萬乃至數(shù)十萬分之一,已經(jīng)在多個文獻和報道中成為了疾病機理的生物學研究和制藥公司的藥物開發(fā)神器。
事實上,這并不是很簡單的過程,因為在2020年年底AlphaFold2在CASP14中預測結果披露之前,很多科學家窮盡一生也很難完全解析出某個蛋白質結構。我們投入3年多的時間在算法上持續(xù)優(yōu)化和迭代才取得了現(xiàn)在的成果,雖然離真正產業(yè)化還需要一段時間。
總的來說,AI算法徹底解決了一個對于生物學家來說長達50多年的重大挑戰(zhàn),并且也已經(jīng)有幾十款AI驅動的在研新藥進入臨床試驗。這展示出AI技術在生物制藥領域不僅僅能起到替代人工和經(jīng)驗、加速研發(fā)的作用,更是有機會通過研發(fā)模式的底層革新幫助科學家們突破新藥研發(fā)的壁壘。
醫(yī)藥魔方:人腦發(fā)現(xiàn)不了的low hanging fruit問題,AI有可能挖掘嗎?
苗洪江:大家知道蛋白質不像小分子必須要有合適的結合口袋,蛋白質的相互作用是通過界面來進行的,因此在安全性、可成藥空間和適用疾病種類上都有更大的潛力。我們開發(fā)蛋白質設計算法的初衷就是希望能夠通過由AI設計的、全新的人工蛋白來攻克這些疾病。
-
首先,以“數(shù)學+物理學”為底層運算邏輯的生物信息學出發(fā),通過大量學習蛋白質序列與結構的關系,能夠準確探索出蛋白質可折疊空間所有潛在的可能性。
-
然后,將在蛋白質折疊中學到的“序列-結構-功能”關聯(lián)反向映射,端到端地從頭進行蛋白質設計、檢測并進行穩(wěn)定性、親和力優(yōu)化,以從頭設計的路線快速生成多肽、抗體、蛋白質等。
-
再次,通過全流程計算優(yōu)化,設計具有穩(wěn)定性高、特異性強、功能可控等優(yōu)異成藥特質的蛋白質,打破當前大分子藥物開發(fā)中完全依賴于天然蛋白質改造的局限性。
醫(yī)藥魔方:對于那些high hanging fruit問題,AI能run出first in class新藥嗎?
苗洪江:飛速發(fā)展的AI算法和快速更新迭代的GPU/TPU帶來的龐大算力,為生物計算提供了很多解決復雜且高維計算難題非常好用的工具。這使得科學家們可以不再依賴被動發(fā)現(xiàn)的方法,而是主動設計治療型蛋白質。
比如由生命科學頂級風投Flagship Pioneering孵化的Generate Biomedicines,基于機器學習驅動的Generative Biology平臺,研究了百萬量級的蛋白質,學習蛋白質功能密碼,從而快速設計、生成執(zhí)行目標功能的新型蛋白質療法。并在2022年1月拿到來自Amgen的5個訂單,預付款約5千萬美元,潛在合約價值超19億美元。
與禮來合作的AI制藥公司AbCellera公司也是非常好的例子。AbCellera的微流控平臺聯(lián)合它的抗體探索和可視化軟件Celium,只用了短短11天,AbCellera就篩選了來自一個康復患者的數(shù)百萬個細胞,鑒定出了數(shù)百個針對SARS-CoV-2的抗體巴尼韋單抗(bamlanivimab),禮來科學家只用了3個月即推入臨床試驗,并且其在2020年10月向FDA提交EUA申請,同年11月便獲得FDA的緊急使用授權(EUA)。
醫(yī)藥魔方:除了解決hanging fruit方面的問題,AI還可能產生哪些積極影響?
苗洪江:我印象很深刻的一個事情就是之前在劍橋的Sanger Institute(桑格研究所)實習的時候,每年固定的幾個日子就會看到抗議動物實驗的人們雷打不動的在門口聚集抗議。隨著AI技術在生物計算領域的快速發(fā)展和廣泛應用,我們可以憧憬不久的未來我們將可以全面的模擬整個細胞甚至組織,對于動物的依賴將會指數(shù)級的減少。
比如當前單克隆抗體藥物的開發(fā)常采用雜交瘤或免疫轉基因小鼠得到野生型抗體,但這個實驗周期不僅需要數(shù)月的時間,其成功率又受到抗原特異性等諸多限制。包括我們的團隊,全球很多科研機構和工業(yè)界團隊都在嘗試利用計算的方法進行抗體設計,這種方法不僅可以大幅減少甚至取代動物使用,更能將研發(fā)周期縮短到數(shù)周且產生出多樣性和特異性遠高于免疫小鼠實驗中獲取的抗體。
應用層:融合挑戰(zhàn)
醫(yī)藥魔方:以AI驅動的蛋白藥開發(fā),技術挑戰(zhàn)來自于哪些方面?
苗洪江:我們是利用AI從頭設計任何我們想要具有特定功能的蛋白藥,即獲得自然界中原本不存在的全新的蛋白質。從階段性成果來看國外相對國內發(fā)展更快,以AI為核心的蛋白質設計已經(jīng)從技術概念過渡到價值驗證階段,也有多款以AI為主導研發(fā)的生物酶、醫(yī)藥蛋白進入臨床試驗階段。
從技術層面,目前已經(jīng)基本突破之前蛋白質設計方法計算復雜粗糙且需要主側鏈反復迭代更新的難題,能夠根據(jù)目標功能快速生成氨基酸序列,實現(xiàn)端到端地進行蛋白質主鏈、側鏈的同時設計,且設計蛋白質長度可控,可以大幅降低免疫原性風險。
像我們除了新冠刺突蛋白結合劑,我們的平臺還設計了IL-2類似物,通過擬合天然IL-2與CD122、CD132的相互作用,激活記憶T細胞及自然殺傷細胞,同時避免與CD25相互作用帶來的毒性和免疫抑制,以此提高藥物的抗腫瘤療效。
醫(yī)藥魔方:一些觀點認為,用AI做新藥研發(fā)只能做參考??赡苤饕菍δ贻p研發(fā)工作者有用,對于資深藥物學家作用有限。您覺得呢?
苗洪江:確實有一些AI制藥公司是圍繞著降低藥物開發(fā)成本和縮短研發(fā)周期為核心來搭建技術能力的,這對于經(jīng)驗豐富的藥物學家來說雖然能起到輔助加速作用但對于藥物開發(fā)整體的幫助有限。這也是為什么雖然已有數(shù)據(jù)證明應用AI技術相比傳統(tǒng)藥物開發(fā)減少了35%的成本,AI制藥仍然會受到傳統(tǒng)藥企的質疑。
但其實AI技術是完全可以在新藥研發(fā)中起到主導作用的,例如我們團隊正在開發(fā)的AI驅動的蛋白質藥物設計平臺,AI模型通過學習億級的蛋白質序列和百萬級的蛋白質結構來建立起“序列-結構-功能”的高維關聯(lián)并基于此來設計結構新穎且具備目標功能的蛋白質。一個僅80aa長的蛋白質就有20^80種可能序列,這種量級的任務是無論多么資深的“老“專家都沒有辦法借助經(jīng)驗完成的,AI在這里的價值也就不言而喻了。
在大分子藥物開發(fā)中,我們有望借助AI技術從“發(fā)現(xiàn)”走向“發(fā)明”的全新階段。當然我們要強調,無論是AI主導還是藥物學家的經(jīng)驗主導,在藥物開發(fā)中兩者都是必不可少,相輔相成的,只有很好地融合雙方優(yōu)勢才能在藥物研發(fā)中起到事半功倍的效果。
醫(yī)藥魔方:AI制藥公司會與合作伙伴在同一靶點上的產生競爭嗎?
苗洪江:熱門靶點的競爭其實普遍存在于所有制藥公司間的,這并不會由于企業(yè)的藥物研發(fā)手段是AI主導或傳統(tǒng)實驗方式主導而改變。從合作伙伴角度來看,如果AI制藥公司與藥企合作開發(fā)同一款藥物,像PD-1這類“紅?!卑悬c,大概率是不會獨立設立另一個同靶點管線項目,這是不符合商業(yè)邏輯的。
長期來看,AI制藥公司與傳統(tǒng)藥企在靶點維度的同質化競爭逐漸減少是大概率會發(fā)生的。因為一款藥物從早期研究到通過臨床驗證送到患者手中是一個復雜且耗時久的流程,大多AI制藥公司是初創(chuàng)企業(yè),還在技術驗證前期,因此基于明確的已知靶點做開發(fā)比較穩(wěn)妥,便于其快速推進項目并建立對自身能力的檢驗。
從更長遠來看,將AI應用于制藥領域并不是為了更快的在相同靶點上比傳統(tǒng)藥企更快的獲得類似的藥物使制藥行業(yè)變得很“卷”,而是希望能夠解決傳統(tǒng)開發(fā)方法開發(fā)無法解決的問題。比如難成藥靶點或者當前沒有被發(fā)現(xiàn)的潛在靶點,做出first in class的藥物來解決未被滿足的醫(yī)療需求,這個目標達成需要有理想的AI制藥公司不斷積累經(jīng)驗和技術能力,加之與合作伙伴的融合與創(chuàng)新來逐步實現(xiàn)。
醫(yī)藥魔方:據(jù)我們觀察,倡導AI研發(fā)藥物目前國內主要是兩撥人來做,一撥是具有有制藥工業(yè)(CADD)研發(fā)背景的,還有一撥是純互聯(lián)網(wǎng)(IT技術)背景。這兩撥創(chuàng)業(yè)者的優(yōu)勢和不足分別是什么?
苗洪江:長久以來藥物研發(fā)都無法擺脫周期長、成本高、成功率低等問題。即便是AI技術的巨大投入,成功研發(fā)創(chuàng)新藥仍是小概率事件,這個行業(yè)需要不同背景的團隊一起攻堅。目前國內做AI研發(fā)藥物的團隊背景大都是多元化交叉融合的,會根據(jù)業(yè)務需求組建不同的新團隊和平臺。
AI技術在2014年出現(xiàn)突破性的進展,大多數(shù)AI研發(fā)藥物公司也都在這個時間點成立,也有數(shù)據(jù)顯示2014年后成立的公司使用AI技術的比重更大?;ヂ?lián)網(wǎng)或者人工智能背景的團隊在使用AI技術、算法、環(huán)境搭建等方面具有優(yōu)勢,能提供性能更好的生物計算平臺;CADD背景專家則經(jīng)歷了上一個計算賦能制藥的周期,在藥物研發(fā)角度會更理解業(yè)務需求,在靶點的發(fā)現(xiàn)、先導化合物的發(fā)現(xiàn)和優(yōu)化、數(shù)據(jù)收集分析以及后續(xù)實驗環(huán)節(jié)等方面更有經(jīng)驗。
相對于大家的初始背景,更為重要的是團隊在研發(fā)過程中的內部相互溝通協(xié)作效率,這需要不同背景科學家在交叉點上協(xié)作、創(chuàng)新和發(fā)明,跨越不同領域之間的溝壑。配合好的團隊整體研發(fā)效率和管理效率都會更高,更容易為充滿不確定性的創(chuàng)新藥研發(fā)帶來有效進展和成果。
風險提示及免責條款
市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據(jù)此投資,責任自負。