最新公告
  • 欢迎您光临欧资源网,本站秉承服务宗旨 履行“站长”责任,销售只是起点 服务永无止境!立即加入我们
  • 机器学习算法与物理如何能共舞?——密度泛函理论

    用机器学习算法解决密度泛函问题?若成功,药物发现、超导研究有望更上一层楼

    如果科学家们能够了解分子中电子的行为,他们就可以预测一切事物的行为,包括实验药物和高温超导体。

    作者 |吴桐

    编辑 |陈才贤

    “AI+X”如火如荼。

    近日,权威学术媒体QuantaMagazine发表了一篇文章,描述了包括DeepMind在内的许多研究团队正在使用机器学习算法来解决物理学领域的一个众所周知的问题——密度泛函理论。

    他们试图利用机器学习算法寻找三阶密度泛函方程,找出人类无法用数学方法描述的电子行为,并突破分子中电子活动的细节。这对药物发现、超导研究和外来材料研究具有重要意义。

    在科学家看来,这是一项重要而令人兴奋的研究,因为密度泛函理论是经典的量子力学理论,而从密度泛函理论来看,它们有望应用于分子和化学等相关领域的一个专业取得突破,又一个人工智能传奇跨越国界。

    那么,机器学习算法和物理如何共舞?让我们来看看QuantaMagazine的要点。

    1 什么是密度泛函理论?

    密度泛函理论的英文名称是“Density Functional Theory”,简称“DFT”。它始于 1960 年代,是一种研究多电子系统电子结构的方法。它在物理和化学中有广泛的应用。特别适用于研究分子和凝聚态的性质,是凝聚态物理、计算材料和计算化学领域最常用的方法之一。

    这似乎有点抽象。举一些图片示例:

    众所周知,近年来超级计算出现了奇迹。 2018年美国超级计算机集群的三大应用密度泛函排名第一,夸克等亚原子粒子研究紧随其后,气候模拟只能排名第三。

    更进一步,2014 年 10 月,《自然》汇编了有史以来被引用次数最多的 100 篇研究论文,其中 12 篇与密度泛函理论有关。这是大自然当时所描述的:

    “我们地球上的一切都依赖于电子的运动——所以 DFT 是一切的基础。”

    图表:密度泛函理论揭示分子中的电子活性,例如 2,3-(S,S)-二甲基环氧乙烷

    几十年来,研究人员一直使用 DFT 来预测事物:2014 年,化学家 Christopher H Hendon 等人。用DFT理论量化了咖啡酸、咖啡因和物种共有的代表性风味成分丁香酚的热力学结合能,由此揭开了咖啡风味形成之谜; 2017年,天文学家利用DFT理论预测木星核心的一致性,相关论文发表在顶级期刊《地球物理研究快报》上。

    英国牛津大学的材料物理学家 Feliciano Giustino:“从本质上讲,DFT 是一种近似,可以让不可能的数学变得简单。”

    要通过考虑每个电子和每个原子核如何与每个电子和原子核相互作用来研究硅晶体中电子的行为,研究人员需要分析 16 万亿(1021) TB 的数据,这远远超出了任何人的处理能力功率。并且计算机将 DFT 的数据需求减少到仅几百 KB,完全在标准笔记本电脑的容量范围内。这证明了计算机科学与 DFT 之间协作的基础。

    另一方面,DFT 为科学家提供了一种快捷方式来预测电子的去向,从而预测原子、分子和其他带有电子的物体的行为方式。物理学家和化学家长期以来一直利用深厚的物理学专业知识来使他们的方程式更好地反映所有电子共有的复杂活动。

    了解电子就是了解构成它们的原子、分子和材料。自从 Erwin Schrödinger 在 1920 年代发表了他的同名方程(“薛定谔波动方程”)以来,物理学家已经彻底了解了电子。

    用机器学习算法解决密度泛函问题?若成功,药物发现、超导研究有望更上一层楼

    图表:薛定谔波动方程

    但是在分析大量电子时,薛定谔方程几乎没有用处,因为电子比粒子更多的是团块。它们在空间中展开,以多种方式重叠和挤压其他电子。随着电子数量的增加,使用薛定谔波动方程来解释所有电子之间的恒定接触的难度呈指数增长。

    加州大学伯克利分校的凝聚态物理学家 Jeffrey Neaton 是这样说的:“即使只有几个粒子,你也需要更多的磁盘空间来将波函数写入磁盘。”

    2 从 DFT 到全密度泛函

    多年来,密度泛函理论的力量吸引了无数研究人员。其中,不得不提的是1998年诺贝尔化学奖获得者物理学家沃尔特·科恩。

    用机器学习算法解决密度泛函问题?若成功,药物发现、超导研究有望更上一层楼

    图表:沃尔特·科恩

    Walter Kohn 出生于奥地利维也纳。 1945年获数学物理学士学位,1946年获多伦多大学应用数学硕士学位,1948年获哈佛大学博士学位。曾任哈佛大学物理系教员大学,卡内基-梅隆大学(CMU)助理教授,加州大学圣地亚哥分校教授兼物理系主任,先后担任加州大学圣巴巴拉分校理论物理研究所1979年。昌河物理学教授。

    1964 年,他和另一位物理学家皮埃尔·霍亨伯格 (Pierre Hohenberg) 找到了一种方法来证明这一点,即通过将分子的电子粘在一起,形成一种更厚一些的液体,完美地捕获分子的各个方面。这种电子汤的密度包含有关分子复杂波函数的所有信息,使物理学家能够对电子执行以前认为不可能的任务。太棒了。

    用机器学习算法解决密度泛函问题?若成功,药物发现、超导研究有望更上一层楼

    说明:研究人员使用基于密度泛函理论的工具来预测 DNA 碱基对周围的电子在被激光脉冲击中时会如何反应。

    Hohenberg 和 Kohn 证明了一个强大的主方程的存在,即“万能密度泛函”。该方程式将以计算“电子液体”的能量为例,引导物理学家采用最低能量和最自然的电子排列。从这个角度看,万能密度泛函非常笼统,原则上可以描述从硅砖到水分子的所有系统。

    唯一的问题是没有人知道这个等式是什么样的。

    很快,在 1965 年,Kohn 和另一位物理学家 Lu Jeu Sham 编写了第一个可用的密度泛函方程。在这个过程中,他们知道编写精确的函数来捕捉电子行为的所有微妙之处是极其困难的,因此他们将谜题一分为二:一半是已知部分,它提供了一组仅对每个细节的平均感知其他 电子的能量;一半是未知部分,例如拜占庭量子效应和非局部相互作用产生的多余能量,统一为一个称为交换和相关函数的容差因子。

    用机器学习算法解决密度泛函问题?若成功,药物发现、超导研究有望更上一层楼

    论文链接:

    目前,Kohn 的两篇关于 DFT 的研究论文在 Nature 的 100 篇论文中分别排名第 34 位和第 39 位。 Kohn 意识到,他可以通过假设每个电子对所有其他(而非单个)电子的反应方式来计算系统的属性,例如其最低能量状态,作为模糊平均值。原则上,数学很简单。该系统的行为就像一个连续的流体,其密度因点而异。这就是该理论得名的地方。

    这种方法最大限度地减少了我们对通用泛函的了解。在接下来的几十年里,科学家们在 Kohn 和 Sham 的工作基础上,采用越来越聪明的方法来估计容差系数,使密度泛函成为理解电子的实用方法。

    在实际应用中,研究人员使用这种方法来预测原子捕获或释放电子的方式、分子振动的方式(例如好奇号火星车用来寻找火星上的生命迹象)、晶格中原子的排列、材料中的声音等。由于该理论的广泛应用,科恩还获得了 1998 年的诺贝尔化学奖。

    3 使用 AI 寻找通用泛函的近似值

    对DFT精度要求更高的研究人员必须考虑泛函交换和相关项的独立性,对函数的细节进行打磨,使其与一般密度泛函更加一致。

    寻找更一般的泛函方程,尤其是泛函方程的近似值,已成为“DFT 爱好者”的新目标。

    天普大学的物理学家 John Perdew 是这方面的先驱。他将通向通用泛函的道路描述为“爬上梯子”。在每个梯级上,物理学家都会向函数添加新组件。最简单的成分是每个位置的“电子炖锅”的厚度。在下一个梯级上,泛函还考虑了从一个位置到另一个位置的厚度变化率,从而使研究更加精确。

    用机器学习算法解决密度泛函问题?若成功,药物发现、超导研究有望更上一层楼

    图表:约翰·珀杜

    Perdew 策略的核心是使用物理推理,它保证对一般泛函的逼近必须服从某些数学属性,即所谓的“精确约束”。更高的步骤有更多的约束需要满足,因此研究人员必须更加努力地找到满足所有这些约束的方程。

    Perdew 的团队于 1999 年开始研究用于混合六种成分的三阶泛函。2015 年,他们发布了当时最先进的泛函,称为“SCAN”。这是他的第八次尝试,也是该功能第一次遵守与第三级相关的所有 17 个已知约束。 SCAN 适用于分子域和固体域,已被证明是迄今为止发现的一般泛函最强大的近似方法之一。

    用机器学习算法解决密度泛函问题?若成功,药物发现、超导研究有望更上一层楼

    论文链接:

    “第三功能的潜力是巨大的。弄清楚什么是重要的,什么是有效的需要时间,”Perdew 说。

    这就是机器学习派上用场的地方。

    4 机器学习入门

    当 Perdew 基于物理直觉改进密度泛函时,一场革命正在酝酿:算法能否找到人类无法用数学方法描述的电子行为模式?

    2012 年,美国加州大学欧文大学的 Kieron Burke 和团队首次尝试将机器学习应用于简化的电子集合。他提出的一维原型促使他和其他研究人员考虑使用机器学习算法来寻找密度函数。

    用机器学习算法解决密度泛函问题?若成功,药物发现、超导研究有望更上一层楼

    论文链接:

    2021 年初,Burke 的团队取得了另一项突破:他和合作者为一个玩具问题构建了一个神经网络,以以前大多数工作忽略的方式跟踪密度和能量误差。相关工作发表在 Physical Review Letters 上。

    用机器学习算法解决密度泛函问题?若成功,药物发现、超导研究有望更上一层楼

    论文链接:

    卢森堡大学的理论化学家 Alexandre Tkatchenko 说:“要获得既能提供密度又能提供能量的泛函需要非常灵活的架构,而仅仅依靠人脑很难编写出泛函公式。”

    石溪大学的 Fernández-Serra 也是研究使用机器学习算法寻找泛函的学者之一。使用类似的策略,她设计了一个神经网络,研究一系列分子和能量,并寻找服从大多数已知约束的三阶函数,本质上是使用机器来追踪 Perdew 的足迹。

    正如她和塞巴斯蒂安·迪克在 2021 年秋季物理评论 B 中报告的那样,由此产生的交换和相关函数在预测不熟悉分子的能量方面比 SCAN 高出约 10%,但这略有增益表明 Perdew 的研究已经接近三阶泛函的上限。

    用机器学习算法解决密度泛函问题?若成功,药物发现、超导研究有望更上一层楼

    “物理直觉已经耗尽了几乎所有的人类智力。不使用机器学习,Perdew 的功能研究真的很完美。” Fernández-Serra 评论道。

    5 DeepMind“瞄准”DFT

    但爬得更高需要更复杂的输入,以及理解这些输入的算法。

    DeepMind 的理论化学家 Aron Cohen 也对寻找更通用的函数方程感兴趣。为了深入研究理论量子化学的抽象视角,他随身携带了一个 3D 打印的蓝色玩具,形状像幸运饼干,弯曲以追踪功能函数的确切形状。它只适用于最简单的系统描述,例如任意两个原子之间共享两个电子的信息,但它也提醒科恩,世界上可能存在一个通用泛函,可以处理任意数量的电子和原子。

    用机器学习算法解决密度泛函问题?若成功,药物发现、超导研究有望更上一层楼

    图例:这个玩具函数描述了任意两个原子之间共享的两个电子。滚珠轴承代表最低能量的排列,倾斜模型会改变原子。

    DFT 研究的主要目标之一是找到这个一般泛函的更准确的近似值。

    众所周知,DeepMind 开发出围棋系统后,一直在寻找新的挑战,尤其关注“科学机器学习”的问题。因此,在花费数年时间研究不能充分反映现实世界的简单系统的精确函数之后,Cohen 提议研究 DFT。

    回顾 Cohen 的研究历程,DFT 的一个核心弱点极大地阻碍了 Cohen:电流密度泛函通常过多地涂抹电子。这个问题在不平衡系统中尤其明显。电子应该主要集中在一个分子上,但 DFT 恰好将电子汁均匀地分布在两个分子上。当化学反应中出现这个问题时,DFT 无法为粒子合并和分离提供正确的能量,即使在氢原子等简单情况下也是如此。

    用机器学习算法解决密度泛函问题?若成功,药物发现、超导研究有望更上一层楼

    为了设计下一代功能,Cohen 和 DeepMind 团队选择不去满足一长串物理原理。相反,他们依靠大量数据,首先在数据库中搜索数千个已知能量的分子(使用薛定谔方程或类似方法以高成本计算)变分法解氢分子离子的薛定谔方程,然后使用超级计算机处理数百个额外分子的能量(其中许多分子需要几天的时间来计算)。

    随着研究团队收集详细的分子样本变分法解氢分子离子的薛定谔方程,科恩和其他化学家随后决定如何构建这些功能。

    他们找到了一种万能的方法:当一个函数的 80% 的能量以一种方式计算,而剩下的 20% 以另一种方式计算时,就会出现一个甜蜜点。该方法是研究人员经过多年的反复试验发现的,用于估计部分交换和相关函数。

    长期以来,研究人员一直在犹豫是否要让分子周围的点以 80/20 的比例变化,但没有人能够完全成功地做到这一点。

    1998 年,Burke 在 ACS 期刊的“Exchange-Correlation Energy Density from Viral Theorem”中介绍了这种函数。但是,他说:“人们可能已经尝试在 100 篇论文中应用这种形式的功能,但他们还没有创造出人人都能使用的东西。也许对一个人来说太难了。”

    用机器学习算法解决密度泛函问题?若成功,药物发现、超导研究有望更上一层楼

    论文链接:

    凭借大量样本分子和DeepMind团队的机器学习专业知识,团队提出的神经网络能够训练出灵活的第四级函数——DM21,其性能优于SCAN等顶级竞争对手估计各种分子的能量,因为它更准确地定位电子并更好地描述它们的自旋。据报道,他们提出的泛函是第一个可以处理化学键断裂和形成的通用泛函。该工作于去年 12 月 9 日发表在《科学》杂志上。

    用机器学习算法解决密度泛函问题?若成功,药物发现、超导研究有望更上一层楼

    论文链接:

    但不可否认的是,DM21也有一个明显的缺点,那就是它只训练元素周期表前三行的分子。虽然数据更加丰富,但这也意味着它所学习的电子行为可能无法转移到金属原子或固体上。材料,这两者对于铜基高温超导系列的分析至关重要。目前,这两个领域的一般功能细节仍然是通过SCAN和其他功能来近似的。

    6 结论

    目前,机器学习刚刚开始成为科学领域的“辅助”。人工智能算法能给科学研究带来多少突破,目前还不得而知。

    但正如 QuantaMagazine 所评估的那样,Fernández-Serra 和 DeepMind 等团队对新泛函的研究表明,机器学习可以成为探索通用密度泛函新领域,尤其是分子和化学相关领域的强大工具。

    Tkatchenko 评论说,机器学习有助于调整化学空间,使泛函尽可能高效。

    但是,改进后的化学泛函能否有效揭示从原子到材料的所有事物的普遍特征,还有待观察。

    Perdew 表示,他将继续寻找新的直观功能,以进一步补充传统研究路径。但他可能不会在机器学习上投入大量时间,“因为虽然机器可以学习,但它们还不能向我们解释它们学到了什么。”

    但 Cohen 认为,已经有可能从 DM21 中看到通用特征,这些特征可能成为未来近似值的持久元素,无论这些特征是由人脑还是由神经网络生成的。

    “功能非常复杂,因此任何实验都很好。理想情况下,我们希望将它们全部统一起来,”科恩说。

    参考链接:

    1.

    2.

    3.

    4.

    用机器学习算法解决密度泛函问题?若成功,药物发现、超导研究有望更上一层楼

    站内大部分资源收集于网络,若侵犯了您的合法权益,请联系我们删除!
    欧资源网 » 机器学习算法与物理如何能共舞?——密度泛函理论

    常见问题FAQ

    免费下载或者VIP会员专享资源能否直接商用?
    本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。
    提示下载完但解压或打开不了?
    最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。若排除这种情况,可在对应资源底部留言,或 联络我们.。
    找不到素材资源介绍文章里的示例图片?
    对于PPT,KEY,Mockups,APP,网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单。
    欧资源网
    一个高级程序员模板开发平台

    发表评论