
主持人:藥物設(shè)計(jì)領(lǐng)域已經(jīng)站在了新一輪爆發(fā)的起點(diǎn),各種技術(shù)涌現(xiàn),我們首先想請教一下幾位嘉賓,對于接下來領(lǐng)域內(nèi)大的技術(shù)發(fā)展有什么預(yù)測,是會呈現(xiàn)出一家獨(dú)大還是百花齊放的態(tài)勢?
彭?。?/strong>我們可以看到包括生物計(jì)算在內(nèi)的許多新技術(shù)在最近三到五年已經(jīng)涌現(xiàn)出來了,我個(gè)人判斷,未來一定是百花齊放的形式。
生物醫(yī)藥行業(yè)和傳統(tǒng)互聯(lián)網(wǎng)以及其他的產(chǎn)業(yè)還是有些區(qū)別的。生物醫(yī)藥行業(yè)是非常長的鏈條,制藥發(fā)展的各個(gè)環(huán)節(jié),從早期靶點(diǎn)到后面的發(fā)現(xiàn),甚至到臨床實(shí)驗(yàn),每一個(gè)環(huán)節(jié)都是在整個(gè)產(chǎn)業(yè)鏈中非常有價(jià)值的部分。不管是從AI還是計(jì)算,甚至是從實(shí)驗(yàn)或其他的角度來講,都必定在這個(gè)產(chǎn)業(yè)鏈的每一個(gè)環(huán)節(jié)中有非常多不同的貢獻(xiàn)。因此,我認(rèn)為我們的行業(yè)在未來相當(dāng)長的一段時(shí)間內(nèi),會呈現(xiàn)出百花齊放的情況。
劉鐵巖:我非常同意彭健的說法。其實(shí),藥物設(shè)計(jì)相關(guān)的研究本身就是一個(gè)非常廣譜且豐富的事情。從研究對象來講,我們有很豐富的藥物設(shè)計(jì),比如小分子藥物、抗體藥、基因療法、PROTAC等,它們的原理與應(yīng)用場景都有很大的差異;從制藥的流程來看,從前端的靶點(diǎn)發(fā)現(xiàn)、先導(dǎo)化合物的篩選優(yōu)化,到后期ADMET的預(yù)測、甚至臨床效果的預(yù)測,各個(gè)環(huán)節(jié)都有各自獨(dú)特的技術(shù)挑戰(zhàn)。面對這樣非常豐富的研究場景,本來就應(yīng)該是百花齊放的狀態(tài)。
但如果我們審視一下今天的AI制藥領(lǐng)域,就會發(fā)現(xiàn)事實(shí)上里面還存在著一些問題。例如有一些扎堆的現(xiàn)象,卷到靶標(biāo)蛋白的結(jié)構(gòu)預(yù)測或者結(jié)合力預(yù)測(binding affinity prediction)這些問題上。之所以會出現(xiàn)扎堆的現(xiàn)象,其中一部分原因是這些領(lǐng)域已經(jīng)有比較成熟的技術(shù),比較容易獲取那些唾手可得的成果。大家沒有以一種長期主義的心態(tài)來思考如何構(gòu)建自己的技術(shù)壁壘。剛才彭健提到我們微軟研究院今年成立了科學(xué)智能中心,我們這個(gè)中心的目的是以更加長遠(yuǎn)、更加基礎(chǔ)的視角來看待人工智能在整個(gè)科學(xué)領(lǐng)域的應(yīng)用,其中就包括AI制藥,希望能夠借由我們的努力引導(dǎo)大家以更長期的心態(tài)來看待這個(gè)領(lǐng)域的研究工作。
方向上應(yīng)該百花齊放,不過下沉到技術(shù)層面,我們還是可以看到一些趨勢的。首先,AlphaFold 2 的成功讓人們體會到了深度學(xué)習(xí)、大數(shù)據(jù)、大模型、大計(jì)算所帶來的不同,而這種不同正是近年來人工智能領(lǐng)域發(fā)展的某種體現(xiàn)。比如,通過預(yù)訓(xùn)練大規(guī)模的基礎(chǔ)模型來實(shí)現(xiàn)AI學(xué)習(xí)的規(guī)模效應(yīng),為豐富的下游任務(wù)提供有力的支撐,例如像微軟投資的GPT-3等都是非常優(yōu)秀的基礎(chǔ)模型。我們相信這種趨勢未來也會在生物醫(yī)藥領(lǐng)域進(jìn)一步延展:比如,如何構(gòu)建更適合小分子通用表示的基礎(chǔ)模型,包括它的骨干結(jié)構(gòu)設(shè)計(jì)以及預(yù)訓(xùn)練的方法;如何有效地解決模型的泛化性和外推性,從而應(yīng)對生物醫(yī)藥領(lǐng)域里有效樣本不足和目標(biāo)問題非常復(fù)雜這樣的一對矛盾。
其次,強(qiáng)化學(xué)習(xí)技術(shù)在藥物設(shè)計(jì)方面應(yīng)該會有很大的發(fā)揮空間,因?yàn)樗幬镌O(shè)計(jì)本質(zhì)上就是一個(gè)搜索問題,各種屬性預(yù)測的深度學(xué)習(xí)模型扮演的就是價(jià)值函數(shù)的角色,而在這些價(jià)值函數(shù)的指導(dǎo)下,如何在巨大的分子空間中尋找到一個(gè)好的原子組合及其三維結(jié)構(gòu),是需要一些巧妙的策略做支撐的,蠻力搜索是不可取的。
目前在深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)這兩個(gè)方面,人們還在大量使用著為傳統(tǒng)領(lǐng)域發(fā)明的人工智能工具,針對制藥領(lǐng)域進(jìn)行的特異化設(shè)計(jì)還非常不足,所以我個(gè)人認(rèn)為在生物醫(yī)藥領(lǐng)域人工智能要走得路還非常遠(yuǎn)。而這就需要我們計(jì)算機(jī)科學(xué)家和生物專家、化學(xué)制藥的專家密切合作。做一個(gè)大膽的預(yù)測,我們有可能需要5-10年的時(shí)間才能真正形成比較穩(wěn)定的技術(shù)路線,也可能再需要5-10年,我們才能夠?qū)χ扑幮袠I(yè)產(chǎn)生本質(zhì)的顛覆性的影響。

唐軍:人工智能技術(shù)可以運(yùn)用到整個(gè)藥物從研發(fā)、中試到生產(chǎn)的所有關(guān)鍵技術(shù)環(huán)節(jié),如人的免疫原性實(shí)驗(yàn),在研發(fā)蛋白藥物、抗體藥物等過程中,作為臨床前毒理試驗(yàn)的重要內(nèi)容,必須完成。傳統(tǒng)的藥物開發(fā)過程是從分子水平到細(xì)胞水平,然后到動物實(shí)驗(yàn),再到人體實(shí)驗(yàn)。我們不能等到了人體實(shí)驗(yàn)才考慮免疫原性,以前的做法是把人的免疫系統(tǒng)通過轉(zhuǎn)基因技術(shù)放在小老鼠的模型上篩選藥物的免疫原性,但準(zhǔn)確率和效率較低,尤其在大量候選藥物篩選的時(shí)候,工作量巨大,耗費(fèi)的金錢成本也較多。
自從有了AI技術(shù)模擬抗原免疫原性篩選系統(tǒng)以后,工作量減少了很多,這樣我們的一些判斷就可以提前到侯選藥物的篩選階段,這個(gè)工作非常有意義,對醫(yī)藥行業(yè)也有非常大的支持。因?yàn)橐粋€(gè)創(chuàng)新藥物要開發(fā)出來往往需要10年的時(shí)間,還需要數(shù)億美元的經(jīng)費(fèi)。假如能在最前面的環(huán)節(jié)解決問題,那么花費(fèi)和時(shí)間都會有所節(jié)省。這給生物醫(yī)藥行業(yè)帶來了顛覆性的改變。
另外,關(guān)于蛋白質(zhì)結(jié)構(gòu)的預(yù)測,我覺得也是非常有意義的。我們都知道氨基酸序列是肽或蛋白的一級結(jié)構(gòu),很快就能測出來的,但是它的二級/三級結(jié)構(gòu)、空間結(jié)構(gòu)、折疊卻很難檢測,或者目前的檢測精度不夠。假如利用了AI技術(shù),那么在蛋白藥物的設(shè)計(jì)和篩選方面會有很大的幫助。

下面我從成果轉(zhuǎn)化和產(chǎn)業(yè)化的角度來談一下,AI和醫(yī)藥結(jié)合的產(chǎn)品是怎么從技術(shù)發(fā)展到新產(chǎn)品上市的,這期間大概會經(jīng)歷哪些比較難跨越的階段。
首先,在實(shí)驗(yàn)室里發(fā)現(xiàn)一個(gè)技術(shù),或者實(shí)驗(yàn)室發(fā)明了一個(gè)新的檢測試劑或藥物,要轉(zhuǎn)化到工業(yè)化生產(chǎn)條件下進(jìn)行生產(chǎn)制造,這就是一個(gè)難點(diǎn)。因?yàn)檫@里面要考慮質(zhì)量的控制、成本的控制,以及中式放大產(chǎn)業(yè)技術(shù)條件的篩選,但是實(shí)驗(yàn)室里的科學(xué)家對這些是沒有概念的,那么就需要工業(yè)界的專家進(jìn)行指導(dǎo)。其次,新藥從研發(fā)到上市最主要的一環(huán)就是需要大量的經(jīng)費(fèi)和時(shí)間投入,那么長久的、持續(xù)的股權(quán)融資就非常重要。第三,在新產(chǎn)品注冊規(guī)劃方面也會比較困難。因?yàn)樗幬锖歪t(yī)療器械的監(jiān)管非常嚴(yán)格,細(xì)分領(lǐng)域的技術(shù)指導(dǎo)原則都非常細(xì)致,所以我們需要有藥物注冊專家,或者器械注冊專家?guī)椭崆耙?guī)劃。尤其是準(zhǔn)備開發(fā)哪些種類新藥、診斷試劑、或者做疫苗,所以一開始就要規(guī)劃好。再者,最難的是人體實(shí)驗(yàn),人體實(shí)驗(yàn)還需要臨床資源、GCP機(jī)構(gòu)和醫(yī)生大量的配合。臨床實(shí)驗(yàn)完成以后,上市銷售也比較困難,創(chuàng)新藥要努力開拓市場,仿制藥要想辦法搶占原研藥的市場,所以還需要銷售專家、醫(yī)保系統(tǒng)、定價(jià)系統(tǒng)和政府相關(guān)部門協(xié)調(diào)、合作,完成上市。
劉鐵巖:唐主任剛才講得非常好,向我們闡述了從技術(shù)研發(fā)到成果落地一系列的環(huán)節(jié),其中也提到了鴻溝的問題,對此,我想稍微做點(diǎn)補(bǔ)充,尤其是從AI的角度來說一說我看到的鴻溝是什么樣子的。
現(xiàn)在,很多從事AI制藥的人都在走一條“捷徑”,比如錨定已有的基準(zhǔn)數(shù)據(jù)集或者一些公開的比賽(常見的如藥物-靶標(biāo)相互作用、藥物-藥物相互作用等),然后在這些任務(wù)上進(jìn)行模型調(diào)優(yōu),以期獲得SOTA結(jié)果。因?yàn)橐坏┯辛诉@樣的結(jié)果就有機(jī)會發(fā)表論文、進(jìn)行宣傳,甚至獲得資本的關(guān)注、實(shí)現(xiàn)研究的產(chǎn)業(yè)化。
但是這樣的技術(shù)研發(fā)路徑是正確的嗎?是否存在問題呢?
首先,我們注意到這些基準(zhǔn)數(shù)據(jù)集很難反映藥物設(shè)計(jì)的全貌和豐富的場景,它們只覆蓋了其中的部分環(huán)節(jié)。所以如何構(gòu)建更加多樣化、更加可信的數(shù)據(jù)集,其實(shí)非常重要。像蛋白質(zhì)結(jié)構(gòu)預(yù)測領(lǐng)域做得就很好,蛋白質(zhì)結(jié)構(gòu)一旦解析出來以后,大家都愿意放到PDB這樣的公開數(shù)據(jù)庫里。但是在醫(yī)藥領(lǐng)域,藥物研發(fā)過程中的數(shù)據(jù)多是藥廠私有的,是不拿出來公開的,這不利于學(xué)術(shù)界從事相關(guān)的研究工作。
其次,如果AI從業(yè)者針對有限已知的數(shù)據(jù)集,面對單一的評價(jià)指標(biāo)只是不斷調(diào)優(yōu),而不是思考模型在目標(biāo)應(yīng)用上是否存在著本質(zhì)的設(shè)計(jì)缺陷,不去解決深層次的問題,那么我們很難保證學(xué)到的AI模型可以在新藥研發(fā)領(lǐng)域有很好的表現(xiàn)。我們絕對不能天真地認(rèn)為,只要手里拿著AI的大錘到處敲一敲就可以顛覆制藥行業(yè)。想要實(shí)現(xiàn)AI+醫(yī)藥就需要跨領(lǐng)域的專家合作,也需要AI從業(yè)者不斷提高自己的修養(yǎng),把相關(guān)領(lǐng)域知識消化吸收。
我另外還有一個(gè)觀點(diǎn)想跟大家分享:如果我們站在AI的角度來看待藥物發(fā)現(xiàn),其實(shí)藥物發(fā)現(xiàn)并不是典型的人工智能問題。為什么這么講呢?藥物發(fā)現(xiàn)的目標(biāo)是所找到的最好的藥物要足夠有效,而不是要求整個(gè)藥物篩選流程里所有的候選藥物在期望意義上都有效。這一點(diǎn)和我們經(jīng)典的機(jī)器學(xué)習(xí)是非常不同的。另外,制藥問題對AI模型的分辨率要求非常高,要細(xì)致到能夠捕捉到關(guān)鍵蛋白的突變信息,而不是像多數(shù)已有的AI模型那樣有很強(qiáng)的光滑性假設(shè)。
最后,剛才唐主任也提到了不管我們前期做什么樣的預(yù)研,最后都需要嚴(yán)苛的臨床實(shí)驗(yàn)過程。目前AI制藥的研究主要集中在臨床之前(preclinical),尚未打通整個(gè)藥物研發(fā)的閉環(huán)。當(dāng)然,一部分原因也是由于臨床階段數(shù)據(jù)更難獲得,問題更加復(fù)雜,更不可控,對已有的人工智能技術(shù)會造成非常大的挑戰(zhàn)。因此很多用計(jì)算方法或者人工智能找到的候選藥物,都折戟在了臨床的階段。
彭?。?/strong>非常感謝劉鐵巖老師和唐主任的分享!唐主任主要從產(chǎn)業(yè)的角度講述了技術(shù)到底是怎么落地的,這里面有許多的困難需要克服,要促成一個(gè)成功的技術(shù)轉(zhuǎn)化甚至落地,中間不僅僅需要AI和技術(shù)層面的提升,也包括政府和產(chǎn)業(yè)的聯(lián)動,才能使真正的技術(shù)從早期的研發(fā)到最終的成果落地持續(xù)貫穿。剛才劉鐵巖老師也給了我們很好的建議,特別是面向AI+醫(yī)藥領(lǐng)域的研究者和創(chuàng)業(yè)者,怎么能夠更好地利用AI去解決一些真正的現(xiàn)實(shí)問題。

我原來也是在學(xué)術(shù)界,去年回國創(chuàng)立了華深智藥公司,我可以從創(chuàng)業(yè)者的身份跟大家分享一下我這一年來的感受。像唐主任說的,我們真正要去做一家公司,想要落地AI技術(shù),這不僅僅是學(xué)術(shù)界要做的事情。前面談到的免疫原性的例子,不管是做核酸藥,還是蛋白藥,它的流程都非常長,當(dāng)我們把早期的工作做了以后,后面還有很多關(guān)于生產(chǎn)等各方面的評估。
2012年以前基本上是以單抗為主,當(dāng)時(shí)做抗體藥物的時(shí)候,大家其實(shí)不考慮這些因素,因?yàn)槟菚r(shí)的技術(shù)還不夠發(fā)達(dá),大家通常想的是只要能夠找到結(jié)合的就可以了,后面有什么問題后面再去解決。如果大家去看2013年以后上市的藥物就會發(fā)現(xiàn),它們和過去的抗體藥物有很大的不同——大家會把后面的生產(chǎn)、驗(yàn)證、臨床逐漸早期化。這樣,很早的時(shí)候我們就能夠把分子找到,從而滿足一些我們想要的性質(zhì),制藥成功率就會大大提高。這一年我也看了許多的例子,也和很多的專家討論過,大家現(xiàn)在認(rèn)為成功率是最為重要的,一旦前面早期的決策做錯(cuò)了,后期的時(shí)間成本和資金成本都是不可估量的。當(dāng)然,提高效率、提高精度是很重要的。但是很多時(shí)候我們需要從產(chǎn)業(yè)鏈條的角度思考這個(gè)問題,就是能夠把重要的信息很早地注入在AI算法里,使得AI算法在設(shè)計(jì)做預(yù)測的時(shí)候就能起到重要的作用。
這一年我從產(chǎn)業(yè)界學(xué)到了很多,比如看問題更綜合。在學(xué)術(shù)界討論的問題有時(shí)候就只考慮成本、精度、計(jì)算速度等等,但后來我們逐漸意識到在藥物研發(fā)的過程中有非常多的參數(shù)要同時(shí)考慮。而且從做產(chǎn)業(yè)的角度而言也是一個(gè)很復(fù)雜的過程,包括資本的運(yùn)作、政策的扶持等等。
唐軍:像彭教授這樣的科學(xué)家,如果想來上海創(chuàng)業(yè),目前是一個(gè)非常好的時(shí)機(jī)。上海關(guān)于產(chǎn)業(yè)高質(zhì)量發(fā)展方面剛剛出臺了一些新的政策。其中,對創(chuàng)新藥物、創(chuàng)新器械、國外注冊的藥物器械等每個(gè)環(huán)節(jié),都有相應(yīng)的政策支持。此外,上海還提出了“1+5+X”的產(chǎn)業(yè)園區(qū)新政策。“1”是張江核心區(qū),“5”是臨港、奉賢、寶山、金山、閔行幾個(gè)大的生物醫(yī)藥基地;“X”指的是很多細(xì)分領(lǐng)域的園區(qū),像浦江鎮(zhèn)的基因谷、張江細(xì)胞治療產(chǎn)業(yè)基地等。很多細(xì)分的產(chǎn)業(yè)園區(qū)我們都制定了相應(yīng)的產(chǎn)業(yè)政策,包括土地規(guī)劃、資金支持、人才服務(wù)、子女教育等保障都做了相關(guān)的政策和規(guī)定。每個(gè)園區(qū)也都跟資本聯(lián)合,搞了產(chǎn)業(yè)支持資金。在這里我也呼吁一下,如果一些科學(xué)家想創(chuàng)業(yè),我想現(xiàn)在是最好的時(shí)機(jī),政府也是大力支持的。特別是AI與生物醫(yī)藥的結(jié)合,對于生物醫(yī)藥我們專門做了關(guān)于數(shù)字化轉(zhuǎn)型的細(xì)分支持政策。
生物醫(yī)藥和AI實(shí)際上都是屬于比較前沿和比較尖端的交叉學(xué)科,都需要頂尖的人才,最后想請問兩位科學(xué)家,在交叉學(xué)科方面有沒有什么經(jīng)驗(yàn)可以分享。

劉鐵巖:就像唐主任說的,AI和生物現(xiàn)在可能是整個(gè)學(xué)術(shù)界、產(chǎn)業(yè)界發(fā)展最快的領(lǐng)域,它們的結(jié)合還會涉及到物理、化學(xué)、數(shù)學(xué)等其他的支撐學(xué)科??鐚W(xué)科的交流和融合從來都不是一件容易的事情,甚至不同學(xué)科詞匯的差異不亞于不同語言之間的差異。
我想從兩方面討論一下跨界合作,或者是跨領(lǐng)域研發(fā)這件事。
首先,我們要構(gòu)建一支高效且多樣化的團(tuán)隊(duì)。比如我們在微軟研究院組建科學(xué)智能團(tuán)隊(duì)的時(shí)候,非常強(qiáng)調(diào)要招三類人:第一是頂級的人工智能科學(xué)家、第二是一流的自然科學(xué)家、第三是有豐富跨界合作經(jīng)驗(yàn)的人才作為粘合劑。這里,我想著重強(qiáng)調(diào)一下頂級人工智能科學(xué)家和頂級自然科學(xué)家的重要性:沒有一流的自然科學(xué)家,我們很難提出真正的一流問題;沒有世界頂級的AI科學(xué)家,我們就沒有能力和魄力去顛覆性地創(chuàng)造新的人工智能算法和工具,只靠拿來主義和魔改是沒有辦法構(gòu)筑真正的技術(shù)壁壘的。
另外,如果兩個(gè)不同學(xué)科的團(tuán)隊(duì)進(jìn)行跨界合作時(shí),那么雙方都必須要有敬畏之心。AI科學(xué)家和自然科學(xué)家不是生產(chǎn)者與消費(fèi)者的關(guān)系、不是運(yùn)動員與裁判員的關(guān)系,而是隊(duì)友、合伙人,是一個(gè)團(tuán)隊(duì)。大家要攜手共創(chuàng),有充分的互信,而不是相互揣測、相互試探、甚至相互鄙視。這一點(diǎn)說起來容易做起來難,大家需要突破一定的固有思維模式的,要有成長型思維。在微軟,我們非常重視成長型思維,鼓勵(lì)不斷突破自己的知識局限,樂于學(xué)習(xí)新知識,勇于踏入新領(lǐng)域,不斷刷新自己的知識瓶頸。
未來AI制藥一定是跨界融合、蓬勃發(fā)展的領(lǐng)域,也希望在這個(gè)過程中,大家能夠不斷地做探索,通過求同存異讓不同背景的人能夠在一起共同把這個(gè)領(lǐng)域發(fā)展好。
彭健:我最后從人才培養(yǎng)的角度來談一談。剛才劉鐵巖老師也說了,我們有很好的自然科學(xué)家和人工智能的專家,也需要位于交叉點(diǎn)的人才,但同時(shí)接受兩邊訓(xùn)練的人才其實(shí)是比較稀缺的。他要能夠同時(shí)理解AI技術(shù),同時(shí)又對自然科學(xué),像藥物發(fā)現(xiàn)、生物學(xué)、化學(xué)有著非常深入的了解,這種人才非常少。之前我們各個(gè)高校的學(xué)科邊界設(shè)立得過于明顯,但很多世界頂級的學(xué)校都是鼓勵(lì)學(xué)生選修其他學(xué)科的專業(yè)。我想,要從本質(zhì)上解決交叉學(xué)科人才的問題,在教育、人才培養(yǎng)方面也需要更多的創(chuàng)新。
主持人:非常感謝三位嘉賓的分享,作為新興的科研領(lǐng)域,生物計(jì)算需要跨學(xué)科、跨行業(yè)、跨產(chǎn)業(yè)部門的溝通與合作。就像剛才三位嘉賓分享的那樣,這也代表了未來科技和產(chǎn)業(yè)發(fā)展的方向。