
在生物学中,颓势每每是无益的。但在材料科学中,颓势不错被有益地调控,从而赋予材料有效的新特色。如今,在钢铁、半导体和太阳能电板等产物的制造过程中,东说念主们会尽心引入原子级颓势,以提高强度、适度导电性、优化性能等等。举例,通过在硅中进行可控掺杂,不错调理载流子浓度;一样,在超宽禁带半导体中进行颓势工程,不错培育其不才一代功率电子器件中的应用后劲。
尽管颓势分析已成为一种巨大的用具,但准确测量制品中不同类型颓势偏执浓度仍然极具挑战性,尤其是在不切割或损坏最终材料的情况下。若是工程师不了解材料中存在的颓势,就可能制造出性能低下或具有非预期特色的产物。尽管现存颓势表征技艺种类广大,但在智谋度、聘请性、可定量性以及是否具有破裂性等方面仍存在显耀局限。
在此布景下,来自麻省理工学院(MIT)的连接团队建议了一种基础型机器学习模子 DefectNet,大约径直从测量声子态密度(PDoS)的振动光谱中预测取代型点颓势的化学种类偏执浓度,即使在多元素共存的情况下亦可齐备。该模子基于来自 2,000 种半导体材料、出奇 16,000 条模拟光谱数据进行教练,罗致定制化提防力机制,可识别最多 6 种不同颓势元素,其浓度边界覆盖 0.2% 至 25%。模子在包含 56 种元素的未见晶体中展现出细致的泛化智商,并可通过践诺数据进行微调。通过对 SiGe 合金与 MgB₂ 超导体的非弹性散射践诺数据进行考证,解释了模子的准确性与可迁徙性。
关连连接效果以「A foundation model for non-destructive defect identification from vibrational spectra」为题,已发表预印本于 arXiv。
连接亮点:
* 将测量声子态密度(PDoS)的振动光谱与机器学习相纠合,为齐备体材料中点颓势的无损表征与定量提供了一条极具后劲的旅途
* 引入光谱提防力机制,惩办低浓度情况下含颓势与无缺晶体的声子光谱可能的确无死别的问题
* 引入机器学习原子间势(MLIPs),惩办基于密度泛函表面(DFT)的声子模拟计较资本昂贵的挑战

论文地址:
https://arxiv.org/abs/2506.00725
https://hyper.ai/cn/papers
数据集:基于 2 千种无缺晶体材料构建数据集
连接构建了一个包含 16,000 条掺杂超等细胞(supercells)的数据集,开始于 2,000 种无缺晶体材料,涵盖二元、三元、四元及五元半导体,如下图所示:

母体化合物组因素类,从二元到五元系统不等,其中三元化合物最为常见
掺代型颓势选自周期表前 56 种元素(不包括传颂气体图),如下图,可单独或组合引入,以模拟信得过共掺杂场景,并为夙昔高维测度打算空间中的颓势工程提供参考。

扫数生成的掺杂超等细胞中掺杂元素的直方图,展示了化学各种性
连接东说念主员罗致机器学习保举器率领掺代元素的聘请——每个结构通过掺杂剂保举器筛选 n 型和 p 型掺杂候选。随后,将母体晶体扩张为包含 433–500 个原子的超晶胞,尺寸自符合调节以保证稀掺杂浓度下限约为 0.2%。掺杂剂被替换进母体晶格,每个掺杂结构经结构弛豫,直到扫数原子力料理到 0.01 eV/Å 以下。结构弛豫后,运用有限位移法计较 PDoS 以评估振动性质,酿成 DefectNet 的谱输入。
* 结构弛豫指玻璃态物资里面原子陈设随时刻或在退火过程中冉冉振荡为更褂讪结构的过程
DefectNet:从 PDoS 中无损地径直识别点颓势的化学种类及浓度
DefectNet 用于从声子光谱预测颓势化学元素及浓度,其合座架构不错拆解为 4 个模块,责任经由如下图所示,模子的办法是从 PDoS 中无损地径直识别点颓势的化学种类及浓度。

DefectNet 责任经由
数据生成(Data Generation)
连接东说念主员构建数据集后,使用 MACE-MP-0 基础型 MLIP 在冻结声子体式下,对无缺晶体及掺杂超等细胞进行高通量结构弛豫与声子计较。为模拟践诺分辨率,还对计较取得的 PDoS 弧线进行了高斯平滑处理。
DefectNet 输入(Input for DefectNet)
模子接受四类输入:母体无缺晶体构成、无缺晶体的 PDoS 、掺杂体系的 PDoS 、可能颓势化学种类的脱手想到。脱手想到不错由东说念主工直观或已有常识提供,也不错通过基于机器学习的颓势保举器自动生成,该保举器是一个概率模子,用于预测最可能的掺代元素。尽管教练数据为模拟数据,该框架测度打算可通过微调,适用于践诺光谱数据(如非弹性中子散射 INS 数据)。
模子架构(Model architecture)
DefectNet 模子基于 PyTorch 齐备,罗致模块化架构,由四个主要部分构成:
* 基于一维卷积的谱编码器(spectral encoder based on 1D convolutions):输入包括三条长度为 100 的一维信号,未掺杂材料的 PDoS 、掺杂后的 PDoS 、宿主晶体构成向量 ,这些信息被拼接为三通说念输入,通过一维卷积相聚索要特征,最终酿成 100 个「谱 token」 ,每个 token 为 128 维向量 。
* 掺杂原子镶嵌模块(dopant embedding module):掺杂候选的脱手想到以 56 维二进制向量提供,指点给定样本琢磨的掺杂元素;该二进制向量通过全不时层投影到相通的 128 维潜在空间,取得单一的掺杂镶嵌向量。该镶嵌向量当作提防力机制的全局查询,使模子大约字据特定的掺杂险峻文调节其谱特征的解释。
* 多头提防力机制(multi-head attention mechanism):为建模掺杂候选与振动特征之间的交互,DefectNet 使用多头自提防力机制,掺杂镶嵌当作查询 Q,188金宝博而谱特征 V 当作键和值矩阵,提防力机制投降步骤的缩放点积公式。
* 掺杂屏蔽模块(dopant-masked module):模子输出为 56 个掺杂元素的浓度预测,但通过「硬掩码」机制,即只好候选元素允许非零输出 ,耗损函数也仅在这些元素上计较 。这带来三重刚正,一是培育教练褂讪性,二是幸免无关类别滋扰 ,三是与物理先验保执一致 。
输出(Output)
最终输出特征字据脱手颓势想到进行硬掩码处理,剔除不在想到辘集中的掺杂元素浓度。这一机制确保 DefectNet 的预测颓势浓度被不休在脱手假设的颓势辘集内,因此,若脱手想到遗漏或不完整,模子可能无法复原某些掺杂元素。
DefectNet 可理会 6 种共存的取代型颓势
为了评估 DefectNet 的智商,连接东说念主员测度打算了系列考试,赶走暴露:DefectNet 可理会多达 6 种共存的取代型颓势,浓度低至 0.2%,且无需详备原子结构信息即可处理 PDoS 数据。
DefectNet 在颓势种类与浓度预测中的应用
连接东说念主员最初在模拟 PDoS 上测试了典型二元(SiC、AlAs)和三元(AgGaS₂、InCuSe₂)半导体。
SiC 与 AlAs 分辨因大带隙而在高功率电子器件与异质结构测度打算中备受意思意思,下图展示了无缺与掺杂晶体的 PDoS 及预测与信得过掺杂浓度。即使掺杂水平较低(约 1%),DefectNet 仍能捕捉到轻细的振动变化,并可靠地复原正确的掺杂浓度。

DefectNet 在典型半导体上的代表性预测(二元半导体 SiC 和 AlAs 的赶走)
接着,连接东说念主员又将 DefectNet 应用于化学更复杂的三元半导体 AgGaS₂ 和 InCuSe₂,赶走如下图。AgGaS₂ 用于红外非线性光学,而 InCuSe₂ 是薄膜光伏的潜在材料。这些材料含有多个不等价原子位点及各种振动形式,但 DefectNet 仍能追踪 PDoS 的变化并推断掺杂浓度,暴闪现其在复杂结构和化学体系中的谨慎性。

DefectNet 在典型半导体上的代表性预测(三元半导体 AgGaS₂ 和 InCuSe₂ 的赶走)
为进一步评估泛化智商,连接东说念主员在包含多种共存掺杂的完整颓势数据集上测试 DefectNet,包括输入中存在但内容不存在的「滋扰」颓势。下图通过比拟预测颓势浓度(彩色点)与信得过值(雀斑),按预测均方裂缝(MSE)四分位分组,展示了赶走:

DefectNet 在各种材料与颓势树立上的预测评估
分散内情况(In-distribution,上图 a):母体晶体在教练数据中出现过,但其颓势信息未知;DefectNet 在广大颓势类型与浓度下均进展高保真,即使输入包含滋扰颓势,模子仍能识别信得过掺杂并剔除滋扰。
分散外情况(Out-of-distribution,上图 b):母体晶体在教练中未出现,预测准确度略有下跌,但 DefectNet 仍能捕捉主要掺杂特征,并为大多量滋扰颓势分拨近零浓度,体现出细致的泛化智商。
在践诺数据上微调 DefectNet
为了考证 DefectNet 的内容应用价值,连接东说念主员在践诺数据上进行了微吞并测试。以热电 SiGe 合金为例,连接东说念主员构建了由 100 个非晶 Si 超胞构成的教练数据集,这些超胞通过 Si-GAP-18 数据库的淬火模拟采样,涵盖从狡滑接近晶态到高度无序的各种结构状况,具体赶走如下图所示:

DefectNet 在 SiGe 合金践诺考证上的微调
跟着无序度加多,PDoS 弧线展宽,60 meV 的光学声子特征峰被遏止(上图 a),为模子微调提供了母体材料。随后,连接东说念主员通过在非晶 Si 超胞中立时替代 Ge 来模拟 SiGe 合金,涵盖从 0% 到 25% 的各种掺杂水平及不同无序度。
微调后,DefectNet 在测试集上达到均方根裂缝(RMSE)0.019,暴闪现巨大的预测性能(上图 b)。进一步将微调后的模子应用于 Si₁₋ₓGeₓ 合金践诺 GPDoS 数据(x = 5%、10%、20%,上图 c),DefectNet 分辨预测 Ge 浓度为 7%、13% 和 22%,与践诺趋势高度一致(上图 d)。
琢磨到在非晶材料中精准量化颓势的固有难度,这一赶走标明 DefectNet 对践诺数据具有很强的预测智商。关于 Al 掺杂多能带超导体 MgB₂,微调后的 DefectNet 可重现掺杂浓度高达 25% 的践诺趋势。
结语:出路开阔,但挑战重重
尽管该模子出路开阔,但其应用仍存在些许挑战。举例:在极低颓势浓度下,振动特征细微且易被噪声障翳,模子明锐性下跌;现时版块仅限于取代型掺杂,若扩张至多种点颓势类型(如裂缝、空位、Frenkel 对或颓势簇)将显耀扩大应用边界; 尽管模拟数据泛化性强,但践诺数据上的微调仍不行或缺,齐备无需再教练即可径直应用于原始践诺光谱的模子照旧远景办法。
量度夙昔金博宝app手机版,DefectNet 代表了颓势科学中朝向吞并、数据驱动范式的辗转一步,其架构自然兼容多模态光谱输入,并为具有特定颓势特征的材料逆向测度打算开放了可能。通过纠合物理驱动暗示、高通量模拟、可扩张学习和践诺微调,DefectNet 为全复杂度信得过材料中的自动化、可解释及非破裂性颓势工程提供了发展旅途。
开云app官方在线入口