如何將人工智慧技術與有機化學合成結合?人工智慧將對有機化學發展產生怎樣的衝擊?
有機化學發展幾百年來,亟待大發展與突破。有機化學研究的試錯成本高,反饋慢,大量科研工作者每日在做重複簡單的工作。未來有機化學如果可以和人工智慧結合,會給有機化學發展帶來怎樣的衝擊?
12 月 10 日補充:
(我不是原題主,本來想是否要把原題主的問題描述省去,但看到大家針對上面的觀點已經有了討論,還是保留了。以下僅針對這篇文章)
(引自知識分子專欄 | 每周播報)
人工智慧也可用來預測化學反應
近年來,已有不少研究關注如何用AI來加速各種類型的化學計算。有些AI可預測分子的結構與性質,而IBM的科研人員則另闢蹊徑:他們讓AI像翻譯語言一樣「翻譯」有機化學反應。這個新的AI將原子視為字母,而將分子視為單詞,並使用現在的一些用於機器翻譯中的方法,來學習不同「單詞」組成的句子有什麼「意思」(產生的反應)。雖然這個AI並不能理解或解釋反應的原理,但測試表明它已經可以達到80%的準確度,並且處理多達150個原子的分子。研究人員計劃在將來將其他因素如溫度、溶劑和pH等納入程序的輸入中,並進一步提高AI的準確度。他們相信,這一AI將能幫助化學家更方便地設計有機化合物的合成路線。
文章及圖片來源:https://spectrum.ieee.org/tech-talk/robotics/artificial-intelligence/artificial-intelligence-learns-chemical-reactions相關問題:有機化學合成領域的人工智慧有哪些優勢和劣勢?
謝邀。
針對提問者的觀點以及原文經行回復,沒有個人意淫和衍生。
21世紀人類所面對的主題大體上認為是兩個。一是生命,二是能源。科學家不斷關注生命的質量的提高,絕症的治癒以及新型清潔能源的開發。尤其是癌症和艾滋病,是一直困擾人類的事情。雖然致病機制較為複雜,但是我們有一個直觀的想法,比如將癌細胞殺死,就可以去治癒癌症。所以我們可以培育多種多樣的癌細胞,然後將不同的物質與其作用,有一天科學家發現如果將可樂和癌細胞作用可以將癌細胞殺死,於是發表了「可樂可將某癌細胞殺死,或成為人類消滅癌症新途徑」。媒體就帶領著人類看到了曙光,都感覺癌症可以消滅了。幾十年中,科學家提出了無數種「可樂」,可是臨床上治療癌症的也始終就是紫杉醇等等三四種藥物,而且效果還不樂觀。
問題出在哪裡?不是說可樂可以殺死癌細胞么?是的可樂可以殺死癌細胞,但是脫離了人體的癌細胞毫無意義。我們體系出來問題,我們要解決的重點出了問題,我要殺死活體內癌細胞,而不是培養皿中的癌細胞。
回到有機化學。
正如題主所問的「如何將人工智慧技術與有機化學合成結合?人工智慧將對有機化學發展產生怎樣的衝擊?」
我先回答第二個問題,按照該報道所闡述的事情,對有機化學基本上沒有任何影響。可以理解他的過程,他將數以萬計的反應類型輸入,這裡對於AI叫做「學習」,然後我們將未知結果的反應底物錄入,他可以告訴我可能發生的反應產物和位置。這看起來是很棒的工作,但是事實上毫無意義,不是說預測本身沒有意義,而是需要AI預測沒有意義。對於有機反應來講,經驗上認為主要收到電子效應和空間效應兩種影響,對於任何一個學習者來說,一個月的對於基礎有機化學的集中學習,是可以完全掌握的,我們看到不同的官能團自然知道他有怎樣的性質,容易與哪些試劑反應。只是需要隨時查找數據確定需要什麼條件可以轉化,但是這與預測本身沒有關係了。
第二,AI對於合成路線的設計。有機化學巨匠 E.J.Corey教授(1990年諾貝爾化學獎得主)就提出過逆合成分析,顧名思義,就是通過產物來逆推原料,產物有雙鍵,那原料就可以用醛/酮通過Wittig/HWE 或者通過CM等等反應進行,產物有6-圓環,那底物就可以設計為 4+2的前體,這是非常非常基礎而且有效的方式,對於AI來講,可能對於人類學習和記憶的反應類型更多,更廣,這是值得肯定一點,但是很多創造性的天然產物的全合成,需要更多思維性的工作。
第三,AI的對於有機化學的預測可實現性。按照報道中的說法,是對已知反應的學習然後進行預測(然而很多文獻本身的數據並非準確的),有機反應和下棋是不同的,下棋的棋盤是固定的格數,當你走出第一步的時候,只要你不把棋盤掀翻,之後的可能性是有限的,所以是可預測的,但是對於有機化學來講,現在所發現的反應類型和個數,可能是所有反應的千萬分之一,在這點上,人工學習的優越性就體現出來了,對於現有的反應,人工會提出更有創造性的改進和發展。
第四,預測結果不是有機化學的目的。文章重點是說AI可以預測有機反應結果,可是預測結果有什麼意義么?沒有。有機化學的重點是達到我們的目的,完成某種轉化,研究某種機理,得到相應化合物。還是那句話,一個月集中學習完基礎有機化學的人都會進行預測。預測不是有機化學的目的,僅僅是做實驗之前的參考,證明這個實驗這麼做,我可能得到目標產物,如此而已。
第五,有機合成的重點不是反應本身,而是操作。「大量科研工作者每日在做重複簡單的工作。」這句話是十分十分十分不正確的,基本上沒有做過實驗的人會有這種理解,認為每天工作是過柱子,搭反應。重點是實驗操作,這個是習慣性和經驗性質的東西,也是保障有機反應順利進行的根本。一個反應100個人做,可能就是100種結果。2014年Bruce C. Gibb 教授在Nature Chemistry 上發表題目 Reproducibility 的論文,講述了一個故事。組內的一個經典反應,突然一個人就沒辦法重複了,這是很糟糕的事情,最好的結果就是可以迅速的重複出來,最壞的結果就是以前的實驗事實涉及造假。很不幸,那個人沒有重複出來,後來找了組裡的一個副教授和face to face 的做實驗,結果副教授做出來了,他還是做不出來,後來有一天他跑過去找Bruce C. Gibb教授說我做出來了,教授問他怎麼回事呢,他說不知道。緊緊是一個加料過程就有很多講究,5個組分,我先加什麼?在什麼溫度下加?什麼時候徹底的除氧?什麼時候需要降溫?什麼時候需要先降溫再升溫再降溫的加料,這些複雜仔細的操作,是確保有機合成順利進行的保障,而不是預測反應本身。相對於智能預測反應,最近幾年Natuer和Science上陸陸續續發表程序化合成更加吸引人,因為從加料到反應,到後處理到分離都是儀器在進行,人們只需要做的就是開關儀器和收集產物就可以了。大大提高了實驗的準確度和穩定程度。但是裝置造假較為昂貴,效率低下以及適用範圍受限等因素,使得他還有很多進步的空間。
最後想說,如何將AI和有機合成的結合。我更希望在文獻檢索上進行精密的整合,當我們需要一個反應的參考模型的時候,我們可以通過更加便捷的得到準確的參考。
希望和更多人討論,最後聲明我的討論是基於原文觀點。如果要討論,也請不要天馬行空。
謝邀,第一次寫科學類的回答,可能層次條理不是很清晰,而且答主不是專業研究有機,所以有些地方不是很準確,也歡迎大家多指出。
[此外手機網頁端無法引用加粗等深入編輯,等有機會用電腦後再繼續編輯,大體意思已經表達出了]
有機化學最大的特點,就是高度可逆性及產物多樣性,這決定了其反應是極其複雜的。化學本身是實驗為基礎的自然科學,機理、原理、各種分類別概括都只是對其做一定的解釋、歸納,使本來雜亂無章的實驗現象看起來稍微有些規律和普遍性,只是人的一種理性認識。機理是解釋反應現象的,而不是規定反應的。我們看到很多這樣的例子:在一套體系下,一系列反應都能得到完美的解釋,但是總有幾個特例不符合,這個時候人們又得用別的方面找出新的機理。[答主有些偏向不可知論 ]
研究新的有機物的性質,人做的是歸納總結,總結的對象是實驗現象,人工智慧也是如此。雖然從電性、構型、位阻等微觀方面,人可以對一系列現象做一定的歸納,但終究他們各對結果貢獻多少,還是要依靠實驗結果。繁雜的實驗可以說是一種比較「必要」的研究過程。人工智慧能做的也許是稍稍簡化這部分過程,但是僅僅依靠計算機理論演算必然會出現不少的偏差。假設人工智慧有一定的偏差分析能力並且學習之,這部分規律可能又不適用於另外一些。普遍性是歸納的,有限的。而正是因為機理不是來規定只是一種解釋,用機理推斷新的產物,如果是很冷門的一些反應或者新的反應而不是一些常見的官能團反應(事實上那些常見官能團反應都有很多意料之外的產物),其成功率會比較低下,最終還是依靠實驗來論證。
AI的整個認識機制當然可以不斷改進,他的整套思維邏輯系統也可以和人的思維不同,但是化學,尤其是有機化學這類實驗性很強的學科,僅憑理論計算誰都無法下定論。學過有機化學的應該都有體會,每次實驗條件控制地再好、副產物預測做得再好總有一些出乎意料的副產物。
上文講述到了副產物,這當然也是制約AI完全取代人類進行有機研究的一方面。人類對於化學的研究在真正本質上能做的很少,不是做的很少。即使理論再發達也很難。機理不是數學定理,讓AI完全綜合幾種不同的機理、綜合各種化合物的本性、外界條件等進行推算,80%的自信率過於自負。何況化學的目的還是實驗,還是要做出這種東西。產物的分離最終還是得人來完成。或許將來會有智能蒸餾儀、智能分液機器人、智能分子式測定機器等高科技的輔助產品,他們做的也最多是「簡化繁雜的重複性實驗手段」--這些人類也已經很熟練的步驟。人工智慧在勞動,或者說是純勞動領域的確表現十分出色,這也正是其最大的優勢,也是答主對於「如何將AI和有機化學結合」的一個觀點。目前實驗太過冗長,非單相反應的幾個小時的時間和低產率大大降低了有機實驗的效率,這個方面AI可以使實驗更省力(如果技術足夠,如AI可以製造高溫高壓、告訴人應該加入什麼催化劑,然後用機器人自動化實驗),但是關鍵步驟把控以及結果分析等,恐怕還是不能完全取代。
再繼續談上文提到的「新反應」。化學的目的就是得到新物質。已有的物質或者已有的物質類別的合成只是工業勞動,不是化學。在已有的反映類型中找「新材料」--即某一特定分子具有的特性,例如各類偶氮染料的不同顏色和揮發度等,也只是較低層的有機研究。尤其地,目前對常見官能團的已知反應來說,科研人員只需要做幾乎重複的實驗方法就可以得到目標化合物。目前最需要最迫切的研究是發現新的反應,一些沒有現有機理解釋的反應。有機與生化在過去有過一定程度的「重疊」,即研究並模仿植物體合成物質的機理來化學地合成一些複雜物質。以前的甾族化合物的最初化學合成研究也是用植物體的一些重要反應作為參考的。那些反應用當時已有的機理都是不能直接推導的。這麼說:如果把有機化學比做一個數學的分支,他的目標是發現新的公式定理,而不是依靠現有的公式定理證明更多的命題及大的結論。黃鳴龍反應大家都很熟悉,他當時找減小迴流時間以及沸點材料催化劑,並不是依靠現有的機理,而是一種理性佔少數實驗佔多數的研究。他之前的沃爾夫和凱希那對於羰基鹼性還原的研究已經有過一套機理,但是他卻突破了這個機理找到了更高效的方法。還是那句話,機理不是來規定反應的,而是解釋反應的。機理的這個性質,決定了AI很難獨立地進行反應物推測以及反應研究。題主的例子看得不是很清楚,是酸和那個化合物形成酯嗎?那麼不能保證芳環上不被取代。好吧暫且不論這個。假設這個能實現,那麼大部分目前的知識已經能夠推出這個。AI應用於科研,絕不僅僅是告訴他諸如RCOCl+NH3—&>RCONH2+HCl之類的道理,讓他能推導出所有醯鹵的氨解,抑或是獨立推斷出別的親核取代--那頂多是基於現有機理--的反應。然而他無法推出RA+HA=RH+A2之類的(打個比方,A沒有實際含義)之類的反應。即使那套機理綜合一下、各種量子學數據綜合一下,它是不成立的,但是實驗如果能得出它的成立性呢?
綜上,答主有機並不是專業研究,只能靠個人的認識得出這麼幾點:化學來源是實驗不是機理,化學本質是創造不是模板照套,化學目的在於操作不是理論計算。
歡迎大家一起討論!
不請自來強答一發。
樓上 @瀝青哥哥 說的已經很充分了,我也來說點什麼。
先說第一個問題。先說結論:人工智慧別說跟有機化學結合,跟任何自然學科結合,都是大趨勢,而且是必須的過程。
先不說預測反應結果或者是反應進度什麼的,我就舉一個化學資料庫的例子:Elsevier的Reaxy。這個東西現在強大到什麼程度呢?除了可以將其現有的資料庫中的有機化合物表徵用譜圖(包括NMR,IR,UV,MS,HPLC等)數據以及製作此化合物的Procedure直接抓包出來之外,它還可以按照各種要求查找你所要的化合物合成方法,比如在某些基團上指定反應,比如說指定某個基團必須轉化為另外一個基團。可能有些人覺得這簡直是小兒科,但是這相對於原來的化學工具來說,已經是非常大的進步了。
至於如何將人工智慧和有機化學結合?我說實話,除了資料庫之外,我真的想不出來其他的能有效結合的方法。在回答這個問題之前我正好看到了一個其他問題的答案:
https://www.zhihu.com/question/263711126/answer/273862483
這一位是做藥物化學的。說實話,看到這篇回答再結合我碩士期間的工作,我才真正感覺得我自己之前對化學的理解簡直幼稚的可笑。 @瀝青哥哥 有一句話說的很好:
有機化學的重點是達到我們的目的,完成某種轉化,研究某種機理,得到相應化合物。
我說一個非常感性的判斷。知乎上的大多數人,或者說絕大多數人,都忘了一句我們在初中的時候第一次上化學課時老師告訴我們的一句話:化學是創造新物質的科學。
明白嗎?創造新物質!
AI再強大,它也只能根據現有的機理(著重強調這句話)來設計反應,預測實驗的結果。但是這樣的結果到底有多大意義?對於有機化學的反應機理來說,主要通過兩種因素來控制,一個是電性一個是位阻。哪怕一個熟讀過邢其毅老先生《基礎有機化學》的本科生都可以在了解某個反應主要通過電性還是位阻控制的情況下判斷反應的走向。可是問題是,無數個實驗室中的無數個結果已經告訴我們,在許多時候,看似簡單的機理判斷反而蘊含著許多不可知的因素影響(方法學論文裡面有個很重要的部分叫做底物拓展,就是為了檢測反應的反應適應性的,因為換個哪怕多一個甲基的底物,都很有可能出現意外的結果)。那麼我的問題是,AI能否在存在不可知的因素下判斷實驗結果?如果不能,那所謂的「準確預測實驗結果」又跟人類的判斷有何本質區別?
再說第二個回答,所謂的衝擊,可以說微乎其微,甚至可以說根本沒有。
原因我說過了。就算AI再強大,你怎麼創造新物質?
不說創造新物質吧,我就拿最近北大楊震老師的一篇論文舉個例子吧:
Enantioselective Total Synthesis of (?)-Pavidolide B, Peng-Peng Zhang?, Zhi-Ming Yan?, Yuan-He Li?, Jian-Xian Gong*?, and Zhen Yang* J. Am. Chem. Soc., 2017, 139 (40), pp 13989–13992.
裡面的關鍵步,是這篇論文中的化合物4,經過一個開環後的自由基反應,直接構建一個六並五並五的複雜大環體系。而且在這個過程中,你還要注意這個反應中各個鍵的立體選擇性。
下面是我的問題:
1,如何通過AI確定這個反應的絕對構型?如果可以,能否告訴我AI產生結果的過程跟人類手動計算相比好在哪裡?
2,如何通過AI算出我所需要的自由基引發劑?能不能通過計算告訴我我應該使用哪一種引發劑或者是哪幾種引發劑?
3,如何通過AI計算算出這種一步構建三環橋連的複雜多環體系?如何通過計算說明這種方法的可行性?
我估計就這些問題已經很難回答了,更不用說下面的如何製備到克級以及公斤級這種問題了。說老實話,AI引入到有機化學併產生有效的結果,還有很長很長很長一段路要走。
我期待著有一天,有機化學家們可以通過計算化學的方式,來設計新的反應(這是方法學的最終目標,通曉所有機理並隨心應用反應)。但是恕我直言,就人類目前的計算水平,我們可能要在等個幾百年才能達到這種狀態(反正我有生之年是看不到了)。
最後說一點自己的私話,也算是一點戾氣吧。
我覺得現在的知乎,對反自然科學(化學和生物)已經到了一種有點反智主義的狀態了。人類目前的科學水平,還遠遠達不到隨心所欲的構建某些化學鍵的水平。
至於某些大V說什麼學有機的學生就是什麼人型過柱機,只會開反應做原料的話,我只想說,這種水平在我所可能連某些碩士生的水平都達不到。
最後送給這些人一句話:
愚蠢和弱小不是毀滅的原因,傲慢才是。
————————————————————————
經 @瀝青哥哥 提醒,說明一下:Reaxy中化合物的NMR譜圖如果存在於專利,是可以直接在Reaxy里顯示的:但是對於發表論文中的譜圖則不行,需要自行去Supporting Information中尋找,特此指正。
謝邀,本人是做有機合成的,恰好也對計算機很感興趣。之前也在做實驗的也想過很多偷懶的方法。例如過柱子分離兩個Rf值相差比較大的化合物,用10多厘米長的抽濾漏斗直接裝一個簡短的硅膠柱,然後干法裝柱上樣,直接用洗脫劑沖,發現效果挺好,根據就能分開兩個化合物。經常冒出這種想法,想讓實驗快一些。
我想過人工智慧應用在化學合成上的話,有很多個方面,下面將一一列舉。在合成路線上可能可以設計一些軟體,把原子之間的作用力和一些規則,分子間的作用力,官能團的性質,各個單元的反應,各種基本化合物的價格作為一些參數直接輸入進去,對這些分子進行計算,直接模擬出這些化合物的性質,也可以直接設計合成路線,甚至鏈接價格,可以直接列出最便宜的最簡短的合成路線。在生產過程中,可以建立一個巨大的物流系統,在裡面基本的化合物都能在很快的時間內送到,在軟體里輸入各種已知的反應以及反應條件和機理,和各種反應的後處理方法,以及自動過柱機。我們要什麼化合物只要輸入進去,就可以自行合成,自行分離,最後得到化合物在藥物領域,可以對人類或者其他生物的已知某個靶點進行分析,它的三維結構結合的靶點應該符合什麼樣的母體結構,根據這個母體結構可以做一些預測,可以直接知道哪些化合物是具有活性的,貌似現在這個已經實現了。
如果這些都可以實現的話,這三個系統合併在一起,那將會產生巨大的能量,只要我們要哪個化合物,系統將會自動設計最優合成路線,自行合成和分離,最終產出化合物,已經完全不需要我們這些搬磚人員,應該會很有意思。如果這些系統有了自主意識,那人類已經阻擋不了他們了,系統想要毀滅人類,直接可以設計出專門針對人類劇毒的某個化合物,甚至能合成一些病毒,秘密進行合成,等到量足夠的時候,一次性投放毀滅人類。最後不得不說,答主可能有被迫害妄想症謝邀
科學伎術的迅猛發展和互相滲透孕育了一門門交叉科學,邊緣科學。其中, 計算機和化學,有機化學的交叉滲透 , 產生了不少新技術新成果。正在崛起的計算機科學中的人工智慧研究 , 能賦予計算機學 習 、 推理和判斷的能力 , 使之 能模擬人的思 維過程 . 如70年代初 , 美國斯坦福大學研製成功的「 化學專家系統 」就可以模擬化學家思維的程序 , 具有專家的知識水平。機器的知識庫中貯存有有機化合物的結構特徵,命名原則 、 各種異構體的區別以及與之 相關的紅外 、紫外、核磁共振、質譜特徵峰形和譜線數據。 使用時 , 只須輸入未知物的各項分析數據 , 計算機即可推斷出未知有機物的化學結構 . 現在 用於 各種波譜數據進行有機分子 結構解析的計算機程序和模擬教學演示 的 程序不斷編製 出來 , 巳經有相當多的定型商品軟體 出 售 . 這方面 的 計算機應用 的研究工作進展順利 , 也 日漸 成熟 。
近十幾年來計算機用於有機合成和教學的研究也在蓬勃地開展並獲得相當的成功 . 有機合成反應數以千計 , 合成路線變換多樣一個化合 物可以有各種不 同的合 成方 法 . 一個分子可以有不同的官能團 異構 , 位置異構 , 立體異構 , 旋光異構 . 這麼豐富的信息內容和隨機變化 、 條件制約 、 邏 輯推理正是計算機容量大 、 處理能力強的適宜的用武之地 . 計算機參與有機合成的設計及研究不僅對劫1合成的教學工作 、 合成路線的設計帶來實際的好處 , 而且也促進了路線選擇 、 有機反應檢索 、 有機分子結構的表示和識別 ( 包括對有機分子亞結構的細微識別) 、 計算機的圖形表示 、 人工智慧等諸多基礎理論領域的研究和發展。
計算機參與設計有機合成 , 可分為兩大類 . 一類是U酥等人研製的程序 , 用數學模型處理化學結構 , 從理論上推導 化學反應和設計合成路線 , 它不僅包括了人們熟知的有機反應 , 還推導出未知的新反應. 第二類是將已知反應的信息貯於計算機的記憶中 , 用以產生可能的合成路線 . 如 6 年舉行的計算機協助有機合成的國際學術討論會 , 會上提交的都是第二類程 序 . 其中 D . A . P e n s a k 和 E ` J. C o r e y 編 制 的 L H A S A [幻 ( L o g ie a n d H e u r is t ie s A p p lie d ot Syn t he ict A an ly st , 用於合 成分 析的邏輯和推斷 ) 程序 , 包括 40 。余個子程序 , 由三萬多 行 F O RT R A N 語句組成 , 貯 存有 600 多個常見的有機反應 . 該程序按有機分子的鍵和環的形成 , 反應類型 、 反應機理 、 反應條件 、 起始物原料 、 產物目標分子來分類 . 應用該程序可以向使用 者提供達到目標分 子的大量可能的反應途徑 , 化學家可以從中作出選擇 。
友情提示一下,有機化學是最早應用人工智慧的領域之一。 1965年世界上第一個專家系統DENDRAL,就是用來輔助解析有機化合物的結構。 這個領域雖然進展比較緩慢,但是一直在進步。
簡單的說,在學術界,有機化學要取得進展,就是由純粹的實驗科學向理論科學進步,還是需要在理論化學方面取得突破,不是單純的人工智慧的問題,時間表不能確定。
但是在工業界,人工智慧和各種自動化技術,在未來一段時間,應該會得到大力的發展,比如說,計算機輔助的反合成分析很早就有了,現在有的化學品電商可以把反合成分析和原料的供貨信息結合起來。 實驗室自動合成儀很早就有了,但是只能做一些特定的反應。但按現在的機器人技術,實驗室工作應該大部分都可以做到自動化,無非是成本問題。
謝邀。我大學還沒有畢業,化學系,自學了《基礎有機化學》,我的認識只到這一階段,所以我只能談談我現階段的認識。 如果只是考慮到合成路線的預測我覺得應該是可以的,我們把所有的反應條件(如催化劑、溫度、壓強、溶劑等)和我們已知的反應機理以及反應後產物的產率的計算公式告訴AI,這樣是不是就可以給人們在合成這個過程上省去很多功夫呢,然後再由我們篩選出最佳方案,路線的問題就解決了。 本人認為人工智慧主要起到的是輔助作用,決定權還是在我們人類身上,因為現階段AI的不確定因素還很多,還不足以替代人類。
推薦閱讀:
※Python 編程,應該養成哪些好的習慣?
※為什麼玩C++的都喜歡調用別人的庫?
※寫代碼很厲害是怎樣一種體驗?
※當碼農難道不需要情商嗎?
※單片機編程能用MAC么?

