海歸學者發(fā)起的公益學術平臺
分享信息,整合資源
交流學術,偶爾風月
近年來,大數(shù)據(jù)集的可用性融進了算法的改進、計算能力的指數(shù)增長,一時間成妖成仙,成就了機器學習,同時也迷住了大批科學家,讓他們朝思暮想,難于自拔。如今,機器學習算法已被成功用于大量特高維輸入數(shù)據(jù)的分類、回歸、聚類或降維研究。實際上,機器學習已被證明在許多領域具有超人(神)的能力(如娛樂、自駕、圖像分類等)。因此,我們日常生活中的大部分內容,如圖像和語音識別、網(wǎng)絡搜索、欺詐檢測、電子郵件/垃圾郵件過濾、信用評分,等等,均來自機器學習算法提供的支持。
雖然數(shù)據(jù)驅動的研究,更具體地說是機器學習,已經(jīng)在生物學或化學領域有著悠久的歷史,但它們最近在固態(tài)材料科學領域的應用,才剛嶄露頭角。計算方法的出現(xiàn)推動了材料科學的第一次計算革命,特別是密度泛函理論(DFT)、蒙特卡羅模擬和分子動力學,使研究人員能夠更有效地探索相位和成分空間。實際上,實驗和計算機模擬的結合使得材料設計的時間和成本大大減少。計算能力的不斷提高和更高效代碼的開發(fā),也允許對大型材料組進行高通量計算研究,以篩選理想的實驗候選者。這些大規(guī)模的模擬和計算以及實驗性高通量研究正在產(chǎn)生大量數(shù)據(jù),使機器學習方法可用于材料科學。隨著這些算法開始找到它們的應用位置,它們預示著第二次計算革命即將到來。由于估計可能的材料數(shù)量與googol(10100)一樣高,因此毫無疑問需要進行這場革命。材料基因組計劃(材料基因組計劃)等項目旨在彌合實驗與理論之間的差距,促進數(shù)據(jù)更密集、更系統(tǒng)的研究方法,從而進一步推動這種范式變革。現(xiàn)可找到許多機器學習在材料科學中成功應用的例子,如,新穩(wěn)定材料的預測、多種材料特性的計算、第一原理計算的加速,等。機器學習算法已經(jīng)徹底改變了其他領域,例如圖像識別。然而,從第一個感知器到現(xiàn)代深度卷積神經(jīng)網(wǎng)絡的發(fā)展是一個漫長而曲折的過程。為了在材料科學中產(chǎn)生顯著的成果,人們不僅須要發(fā)揮機器學習技術的優(yōu)勢,還應運用已經(jīng)在其他領域學到的經(jīng)驗教訓。由于機器學習方法向材料科學的引入仍處鴻蒙之期,許多已發(fā)表的應用程序在性質和復雜性方面都是相當基礎的。它們通常將模型擬合到極小的訓練集,甚至將機器學習方法應用于可能在數(shù)百個CPU小時內繪制出來的合成空間。當然可以使用機器學習方法作為小型低維數(shù)據(jù)集的簡單擬合程序,但這并沒有發(fā)揮其巨大潛力,也不能證明機器學習方法在其他領域的成功可以復制。 此外,與進入不同的科學領域一樣,必須正確應用命名法。一個例子是表達“深度學習”,其描述的是機器學習方法新近成功的大部分(如,在圖像識別和自然語言處理)。將一個人的工作描述為深度學習當然很誘人,但將具有一個或兩個完全連接的隱藏層的神經(jīng)網(wǎng)絡,表示為深度學習對于剛接觸該主題的研究人員來說是混亂的,并且錯誤地表達了深度學習算法的目的。深度學習的成功源于深度神經(jīng)網(wǎng)絡,在沒有人為干預的情況下,學習具有不同抽象層次的數(shù)據(jù)描述符的能力。當然,這不是雙層神經(jīng)網(wǎng)絡的情況。機器學習算法在科學中的主要批評之一是缺乏使用它們的新法則,理解和知識。這是因為機器學習算法通常被視為黑匣子,因為機器制造的模型太復雜和太陌生,人類無法理解。來自德國馬丁路德大學物理研究所的Miguel A. L. Marques教授,專注于詳細討論和分析固態(tài)材料科學(特別是最新的固態(tài)材料科學)機器學習的各種應用。由于機器學習算法在幾個不同的科學和技術領域中取得了無與倫比的成功(神一般的成功),這些應用在過去幾年中一直在蓬勃發(fā)展。該綜述首先介紹了機器學習,特別是材料科學中的機器學習原理、算法、描述符和數(shù)據(jù)庫(人的理論貢獻)。然后,介紹了固態(tài)材料科學中機器學習的眾多應用(應用是目的和推動力):新穩(wěn)定材料的發(fā)現(xiàn)及其結構的預測、材料特性的機器學習計算、材料科學模擬的機器學習力場的發(fā)展、通過機器學習方法構建DFT功能、通過主動學習優(yōu)化自適應設計過程,以及機器學習模型的可解釋性和物理認識。最后,討論了機器學習在材料科學中面臨的挑戰(zhàn)和局限,并提出了一些克服或規(guī)避它們的研究策略。作者堅信,這一系列高效的統(tǒng)計工具確實能夠大大加快基礎研究和應用研究的速度(夢想)。因此,它們顯然不僅僅是一種短暫作用于材料科學的方式,而肯定一直是未來幾年塑造材料科學的力量。該文近期發(fā)表于npj Computational Materials 5: 83 (2019),英文標題與摘要如下,點擊左下角“閱讀原文”可以自由獲取論文PDF。
Recent advances and applications of machine learning in solid-state materials science
Jonathan Schmidt, Mário R. G. Marques, Silvana Botti & Miguel A. L. Marques
One of the most exciting tools that have entered the material science toolbox in recent years is machine learning. This collection of statistical methods has already proved to be capable of considerably speeding up both fundamental and applied research. At present, we are witnessing an explosion of works that develop and apply machine learning to solid-state systems. We provide a comprehensive overview and analysis of the most recent research in this topic. As a starting point, we introduce machine learning principles, algorithms, descriptors, and databases in materials science. We continue with the description of different machine learning approaches for the discovery of stable materials and the prediction of their crystal structure. Then we discuss research in numerous quantitative structure–property relationships and various approaches for the replacement of first-principle methods by machine learning. We review how active learning and surrogate-based optimization can be applied to improve the rational design process and related examples of applications. Two major questions are always the interpretability of and the physical understanding gained from machine learning models. We consider therefore the different facets of interpretability and their importance in materials science. Finally, we propose solutions and future research paths for various challenges in computational materials science.
本站僅提供存儲服務,所有內容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權內容,請
點擊舉報。