Pymatgen材料科学分析库Skill pymatgen

Pymatgen是一个Python库,专为材料科学设计,提供晶体结构创建与转换、相图计算、电子结构分析、表面和界面研究、Materials Project数据库集成等功能。适用于计算材料科学、高通量工作流和材料数据分析。关键词:材料科学、Python、分析工具、晶体结构、相图、电子结构、Materials Project、计算材料学。

数据分析 0 次安装 0 次浏览 更新于 3/16/2026

名称: pymatgen 描述: “材料科学工具包。包含晶体结构(CIF、POSCAR)、相图、能带结构、态密度、Materials Project集成、格式转换,适用于计算材料科学。”

Pymatgen - Python材料基因组

概述

Pymatgen是一个全面的Python库,用于材料分析,支持Materials Project。创建、分析和操作晶体结构与分子,计算相图和热力学性质,分析电子结构(能带结构、态密度),生成表面和界面,以及访问Materials Project的计算材料数据库。支持来自各种计算代码的100多种文件格式。

何时使用此技能

此技能应在以下情况下使用:

  • 在材料科学中处理晶体结构或分子系统
  • 在结构文件格式之间转换(CIF、POSCAR、XYZ等)
  • 分析对称性、空间群或配位环境
  • 计算相图或评估热力学稳定性
  • 分析电子结构数据(带隙、态密度、能带结构)
  • 生成表面、板片或研究界面
  • 通过程序化方式访问Materials Project数据库
  • 设置高通量计算工作流
  • 分析扩散、磁性或机械性质
  • 使用VASP、Gaussian、Quantum ESPRESSO或其他计算代码

快速入门指南

安装

# 核心pymatgen
pip install pymatgen

# 带Materials Project API访问
pip install pymatgen mp-api

# 可选依赖项以扩展功能
pip install pymatgen[analysis]  # 额外分析工具
pip install pymatgen[vis]       # 可视化工具

基本结构操作

from pymatgen.core import Structure, Lattice

# 从文件读取结构(自动格式检测)
struct = Structure.from_file("POSCAR")

# 从零创建结构
lattice = Lattice.cubic(3.84)
struct = Structure(lattice, ["Si", "Si"], [[0,0,0], [0.25,0.25,0.25]])

# 写入不同格式
struct.to(filename="structure.cif")

# 基本性质
print(f"化学式: {struct.composition.reduced_formula}")
print(f"空间群: {struct.get_space_group_info()}")
print(f"密度: {struct.density:.2f} g/cm³")

Materials Project集成

# 设置API密钥
export MP_API_KEY="your_api_key_here"
from mp_api.client import MPRester

with MPRester() as mpr:
    # 通过材料ID获取结构
    struct = mpr.get_structure_by_material_id("mp-149")

    # 搜索材料
    materials = mpr.materials.summary.search(
        formula="Fe2O3",
        energy_above_hull=(0, 0.05)
    )

核心功能

1. 结构创建与操作

使用多种方法创建结构并执行变换。

从文件:

# 自动格式检测
struct = Structure.from_file("structure.cif")
struct = Structure.from_file("POSCAR")
mol = Molecule.from_file("molecule.xyz")

从零开始:

from pymatgen.core import Structure, Lattice

# 使用晶格参数
lattice = Lattice.from_parameters(a=3.84, b=3.84, c=3.84,
                                  alpha=120, beta=90, gamma=60)
coords = [[0, 0, 0], [0.75, 0.5, 0.75]]
struct = Structure(lattice, ["Si", "Si"], coords)

# 从空间群
struct = Structure.from_spacegroup(
    "Fm-3m",
    Lattice.cubic(3.5),
    ["Si"],
    [[0, 0, 0]]
)

变换:

from pymatgen.transformations.standard_transformations import (
    SupercellTransformation,
    SubstitutionTransformation,
    PrimitiveCellTransformation
)

# 创建超胞
trans = SupercellTransformation([[2,0,0],[0,2,0],[0,0,2]])
supercell = trans.apply_transformation(struct)

# 替换元素
trans = SubstitutionTransformation({"Fe": "Mn"})
new_struct = trans.apply_transformation(struct)

# 获取原胞
trans = PrimitiveCellTransformation()
primitive = trans.apply_transformation(struct)

参考: 有关Structure、Lattice、Molecule及相关类的全面文档,请参见references/core_classes.md

2. 文件格式转换

在100多种文件格式之间转换,支持自动格式检测。

使用便捷方法:

# 读取任何格式
struct = Structure.from_file("input_file")

# 写入任何格式
struct.to(filename="output.cif")
struct.to(filename="POSCAR")
struct.to(filename="output.xyz")

使用转换脚本:

# 单文件转换
python scripts/structure_converter.py POSCAR structure.cif

# 批量转换
python scripts/structure_converter.py *.cif --output-dir ./poscar_files --format poscar

参考: 有关所有支持的格式和代码集成的详细文档,请参见references/io_formats.md

3. 结构分析与对称性

分析结构的对称性、配位等性质。

对称性分析:

from pymatgen.symmetry.analyzer import SpacegroupAnalyzer

sga = SpacegroupAnalyzer(struct)

# 获取空间群信息
print(f"空间群: {sga.get_space_group_symbol()}")
print(f"编号: {sga.get_space_group_number()}")
print(f"晶系: {sga.get_crystal_system()}")

# 获取传统/原胞
conventional = sga.get_conventional_standard_structure()
primitive = sga.get_primitive_standard_structure()

配位环境:

from pymatgen.analysis.local_env import CrystalNN

cnn = CrystalNN()
neighbors = cnn.get_nn_info(struct, n=0)  # 位点0的邻居

print(f"配位数: {len(neighbors)}")
for neighbor in neighbors:
    site = struct[neighbor['site_index']]
    print(f"  {site.species_string} 在 {neighbor['weight']:.3f} Å")

使用分析脚本:

# 全面分析
python scripts/structure_analyzer.py POSCAR --symmetry --neighbors

# 导出结果
python scripts/structure_analyzer.py structure.cif --symmetry --export json

参考: 有关所有分析功能的详细文档,请参见references/analysis_modules.md

4. 相图与热力学

构建相图并分析热力学稳定性。

相图构建:

from mp_api.client import MPRester
from pymatgen.analysis.phase_diagram import PhaseDiagram, PDPlotter

# 从Materials Project获取条目
with MPRester() as mpr:
    entries = mpr.get_entries_in_chemsys("Li-Fe-O")

# 构建相图
pd = PhaseDiagram(entries)

# 检查稳定性
from pymatgen.core import Composition
comp = Composition("LiFeO2")

# 查找成分对应的条目
for entry in entries:
    if entry.composition.reduced_formula == comp.reduced_formula:
        e_above_hull = pd.get_e_above_hull(entry)
        print(f"能量高于凸包: {e_above_hull:.4f} eV/原子")

        if e_above_hull > 0.001:
            # 获取分解
            decomp = pd.get_decomposition(comp)
            print("分解为:", decomp)

# 绘图
plotter = PDPlotter(pd)
plotter.show()

使用相图脚本:

# 生成相图
python scripts/phase_diagram_generator.py Li-Fe-O --output li_fe_o.png

# 分析特定成分
python scripts/phase_diagram_generator.py Li-Fe-O --analyze "LiFeO2" --show

参考: 有关详细示例,请参见references/analysis_modules.md(相图部分)和references/transformations_workflows.md(工作流2)。

5. 电子结构分析

分析能带结构、态密度和电子性质。

能带结构:

from pymatgen.io.vasp import Vasprun
from pymatgen.electronic_structure.plotter import BSPlotter

# 从VASP计算读取
vasprun = Vasprun("vasprun.xml")
bs = vasprun.get_band_structure()

# 分析
band_gap = bs.get_band_gap()
print(f"带隙: {band_gap['energy']:.3f} eV")
print(f"直接带隙: {band_gap['direct']}")
print(f"是金属: {bs.is_metal()}")

# 绘图
plotter = BSPlotter(bs)
plotter.save_plot("band_structure.png")

态密度:

from pymatgen.electronic_structure.plotter import DosPlotter

dos = vasprun.complete_dos

# 获取元素投影态密度
element_dos = dos.get_element_dos()
for element, element_dos_obj in element_dos.items():
    print(f"{element}: {element_dos_obj.get_gap():.3f} eV")

# 绘图
plotter = DosPlotter()
plotter.add_dos("总态密度", dos)
plotter.show()

参考: 有关详细信息,请参见references/analysis_modules.md(电子结构部分)和references/io_formats.md(VASP部分)。

6. 表面与界面分析

生成板片、分析表面和研究界面。

板片生成:

from pymatgen.core.surface import SlabGenerator

# 生成特定Miller指数的板片
slabgen = SlabGenerator(
    struct,
    miller_index=(1, 1, 1),
    min_slab_size=10.0,      # Å
    min_vacuum_size=10.0,    # Å
    center_slab=True
)

slabs = slabgen.get_slabs()

# 写入板片
for i, slab in enumerate(slabs):
    slab.to(filename=f"slab_{i}.cif")

Wulff形状构建:

from pymatgen.analysis.wulff import WulffShape

# 定义表面能
surface_energies = {
    (1, 0, 0): 1.0,
    (1, 1, 0): 1.1,
    (1, 1, 1): 0.9,
}

wulff = WulffShape(struct.lattice, surface_energies)
print(f"表面积: {wulff.surface_area:.2f} Ų")
print(f"体积: {wulff.volume:.2f} ų")

wulff.show()

吸附位点查找:

from pymatgen.analysis.adsorption import AdsorbateSiteFinder
from pymatgen.core import Molecule

asf = AdsorbateSiteFinder(slab)

# 查找位点
ads_sites = asf.find_adsorption_sites()
print(f"顶部位点: {len(ads_sites['ontop'])}")
print(f"桥接位点: {len(ads_sites['bridge'])}")
print(f"空洞位点: {len(ads_sites['hollow'])}")

# 添加吸附物
adsorbate = Molecule("O", [[0, 0, 0]])
ads_struct = asf.add_adsorbate(adsorbate, ads_sites["ontop"][0])

参考: 有关详细信息,请参见references/analysis_modules.md(表面与界面部分)和references/transformations_workflows.md(工作流3和9)。

7. Materials Project数据库访问

通过程序化方式访问Materials Project数据库。

设置:

  1. https://next-gen.materialsproject.org/获取API密钥
  2. 设置环境变量:export MP_API_KEY="your_key_here"

搜索与检索:

from mp_api.client import MPRester

with MPRester() as mpr:
    # 按化学式搜索
    materials = mpr.materials.summary.search(formula="Fe2O3")

    # 按化学系统搜索
    materials = mpr.materials.summary.search(chemsys="Li-Fe-O")

    # 按性质筛选
    materials = mpr.materials.summary.search(
        chemsys="Li-Fe-O",
        energy_above_hull=(0, 0.05),  # 稳定/亚稳定
        band_gap=(1.0, 3.0)            # 半导体
    )

    # 获取结构
    struct = mpr.get_structure_by_material_id("mp-149")

    # 获取能带结构
    bs = mpr.get_bandstructure_by_material_id("mp-149")

    # 获取相图条目
    entries = mpr.get_entries_in_chemsys("Li-Fe-O")

参考: 有关全面的API文档和示例,请参见references/materials_project_api.md

8. 计算工作流设置

为各种电子结构代码设置计算。

VASP输入生成:

from pymatgen.io.vasp.sets import MPRelaxSet, MPStaticSet, MPNonSCFSet

# 松弛
relax = MPRelaxSet(struct)
relax.write_input("./relax_calc")

# 静态计算
static = MPStaticSet(struct)
static.write_input("./static_calc")

# 能带结构(非自洽)
nscf = MPNonSCFSet(struct, mode="line")
nscf.write_input("./bandstructure_calc")

# 自定义参数
custom = MPRelaxSet(struct, user_incar_settings={"ENCUT": 600})
custom.write_input("./custom_calc")

其他代码:

# Gaussian
from pymatgen.io.gaussian import GaussianInput

gin = GaussianInput(
    mol,
    functional="B3LYP",
    basis_set="6-31G(d)",
    route_parameters={"Opt": None}
)
gin.write_file("input.gjf")

# Quantum ESPRESSO
from pymatgen.io.pwscf import PWInput

pwin = PWInput(struct, control={"calculation": "scf"})
pwin.write_file("pw.in")

参考: 有关工作流示例,请参见references/io_formats.md(电子结构代码I/O部分)和references/transformations_workflows.md

9. 高级分析

衍射图案:

from pymatgen.analysis.diffraction.xrd import XRDCalculator

xrd = XRDCalculator()
pattern = xrd.get_pattern(struct)

# 获取峰
for peak in pattern.hkls:
    print(f"2θ = {peak['2theta']:.2f}°, hkl = {peak['hkl']}")

pattern.plot()

弹性性质:

from pymatgen.analysis.elasticity import ElasticTensor

# 从弹性张量矩阵
elastic_tensor = ElasticTensor.from_voigt(matrix)

print(f"体模量: {elastic_tensor.k_voigt:.1f} GPa")
print(f"剪切模量: {elastic_tensor.g_voigt:.1f} GPa")
print(f"杨氏模量: {elastic_tensor.y_mod:.1f} GPa")

磁性排序:

from pymatgen.transformations.advanced_transformations import MagOrderingTransformation

# 枚举磁性排序
trans = MagOrderingTransformation({"Fe": 5.0})
mag_structs = trans.apply_transformation(struct, return_ranked_list=True)

# 获取最低能量磁性结构
lowest_energy_struct = mag_structs[0]['structure']

参考: 有关全面的分析模块文档,请参见references/analysis_modules.md

捆绑资源

脚本 (scripts/)

可执行Python脚本用于常见任务:

  • structure_converter.py: 在结构文件格式之间转换

    • 支持批量转换和自动格式检测
    • 用法:python scripts/structure_converter.py POSCAR structure.cif
  • structure_analyzer.py: 全面结构分析

    • 对称性、配位、晶格参数、距离矩阵
    • 用法:python scripts/structure_analyzer.py structure.cif --symmetry --neighbors
  • phase_diagram_generator.py: 从Materials Project生成相图

    • 稳定性分析和热力学性质
    • 用法:python scripts/phase_diagram_generator.py Li-Fe-O --analyze "LiFeO2"

所有脚本包含详细帮助:python scripts/script_name.py --help

参考 (references/)

全面的文档按需加载到上下文中:

  • core_classes.md: Element、Structure、Lattice、Molecule、Composition类
  • io_formats.md: 文件格式支持和代码集成(VASP、Gaussian等)
  • analysis_modules.md: 相图、表面、电子结构、对称性
  • materials_project_api.md: 完整的Materials Project API指南
  • transformations_workflows.md: 变换框架和常见工作流

当需要关于特定模块或工作流的详细信息时,加载参考。

常见工作流

高通量结构生成

from pymatgen.transformations.standard_transformations import SubstitutionTransformation
from pymatgen.io.vasp.sets import MPRelaxSet

# 生成掺杂结构
base_struct = Structure.from_file("POSCAR")
dopants = ["Mn", "Co", "Ni", "Cu"]

for dopant in dopants:
    trans = SubstitutionTransformation({"Fe": dopant})
    doped_struct = trans.apply_transformation(base_struct)

    # 生成VASP输入
    vasp_input = MPRelaxSet(doped_struct)
    vasp_input.write_input(f"./calcs/Fe_{dopant}")

能带结构计算工作流

# 1. 松弛
relax = MPRelaxSet(struct)
relax.write_input("./1_relax")

# 2. 静态(松弛后)
relaxed = Structure.from_file("1_relax/CONTCAR")
static = MPStaticSet(relaxed)
static.write_input("./2_static")

# 3. 能带结构(非自洽)
nscf = MPNonSCFSet(relaxed, mode="line")
nscf.write_input("./3_bandstructure")

# 4. 分析
from pymatgen.io.vasp import Vasprun
vasprun = Vasprun("3_bandstructure/vasprun.xml")
bs = vasprun.get_band_structure()
bs.get_band_gap()

表面能计算

# 1. 获取体能量
bulk_vasprun = Vasprun("bulk/vasprun.xml")
bulk_E_per_atom = bulk_vasprun.final_energy / len(bulk)

# 2. 生成并计算板片
slabgen = SlabGenerator(bulk, (1,1,1), 10, 15)
slab = slabgen.get_slabs()[0]

MPRelaxSet(slab).write_input("./slab_calc")

# 3. 计算表面能(计算后)
slab_vasprun = Vasprun("slab_calc/vasprun.xml")
E_surf = (slab_vasprun.final_energy - len(slab) * bulk_E_per_atom) / (2 * slab.surface_area)
E_surf *= 16.021766  # 转换eV/Ų为J/m²

更多工作流: 有关10个详细工作流示例,请参见references/transformations_workflows.md

最佳实践

结构处理

  1. 使用自动格式检测: Structure.from_file()处理大多数格式
  2. 优先使用不可变结构: 当结构不应改变时,使用IStructure
  3. 检查对称性: 使用SpacegroupAnalyzer减少到原胞
  4. 验证结构: 检查重叠原子或不合理的键长

文件I/O

  1. 使用便捷方法: 优先使用from_file()to()
  2. 明确指定格式: 当自动检测失败时
  3. 处理异常: 将文件I/O包装在try-except块中
  4. 使用序列化: 用于版本安全存储的as_dict()/from_dict()

Materials Project API

  1. 使用上下文管理器: 始终使用with MPRester() as mpr:
  2. 批量查询: 一次请求多个项目
  3. 缓存结果: 本地保存常用数据
  4. 有效筛选: 使用性质筛选器减少数据传输

计算工作流

  1. 使用输入集: 优先使用MPRelaxSetMPStaticSet而不是手动INCAR
  2. 检查收敛性: 始终验证计算是否收敛
  3. 跟踪变换: 使用TransformedStructure用于可追溯性
  4. 组织计算: 使用清晰的目录结构

性能

  1. 减少对称性: 尽可能使用原胞
  2. 限制邻居搜索: 指定合理的截止半径
  3. 使用适当的方法: 不同分析工具有不同的速度/准确性权衡
  4. 并行化可能时: 许多操作可以并行化

单位与约定

Pymatgen统一使用原子单位:

  • 长度: 埃(Å)
  • 能量: 电子伏特(eV)
  • 角度: 度(°)
  • 磁矩: 玻尔磁子(μB)
  • 时间: 飞秒(fs)

需要时使用pymatgen.core.units转换单位。

与其他工具集成

Pymatgen无缝集成以下工具:

  • ASE(原子模拟环境)
  • Phonopy(声子计算)
  • BoltzTraP(输运性质)
  • Atomate/Fireworks(工作流管理)
  • AiiDA(可追溯性跟踪)
  • Zeo++(孔分析)
  • OpenBabel(分子转换)

故障排除

导入错误: 安装缺失的依赖项

pip install pymatgen[analysis,vis]

API密钥未找到: 设置MP_API_KEY环境变量

export MP_API_KEY="your_key_here"

结构读取失败: 检查文件格式和语法

# 尝试明确指定格式
struct = Structure.from_file("file.txt", fmt="cif")

对称性分析失败: 结构可能有数值精度问题

# 增加容差
from pymatgen.symmetry.analyzer import SpacegroupAnalyzer
sga = SpacegroupAnalyzer(struct, symprec=0.1)

附加资源

版本说明

此技能设计用于pymatgen 2024.x及更高版本。对于Materials Project API,使用mp-api包(与旧版pymatgen.ext.matproj分开)。

要求:

  • Python 3.10或更高
  • pymatgen >= 2023.x
  • mp-api(用于Materials Project访问)