名称: pymatgen 描述: “材料科学工具包。包含晶体结构(CIF、POSCAR)、相图、能带结构、态密度、Materials Project集成、格式转换,适用于计算材料科学。”
Pymatgen - Python材料基因组
概述
Pymatgen是一个全面的Python库,用于材料分析,支持Materials Project。创建、分析和操作晶体结构与分子,计算相图和热力学性质,分析电子结构(能带结构、态密度),生成表面和界面,以及访问Materials Project的计算材料数据库。支持来自各种计算代码的100多种文件格式。
何时使用此技能
此技能应在以下情况下使用:
- 在材料科学中处理晶体结构或分子系统
- 在结构文件格式之间转换(CIF、POSCAR、XYZ等)
- 分析对称性、空间群或配位环境
- 计算相图或评估热力学稳定性
- 分析电子结构数据(带隙、态密度、能带结构)
- 生成表面、板片或研究界面
- 通过程序化方式访问Materials Project数据库
- 设置高通量计算工作流
- 分析扩散、磁性或机械性质
- 使用VASP、Gaussian、Quantum ESPRESSO或其他计算代码
快速入门指南
安装
# 核心pymatgen
pip install pymatgen
# 带Materials Project API访问
pip install pymatgen mp-api
# 可选依赖项以扩展功能
pip install pymatgen[analysis] # 额外分析工具
pip install pymatgen[vis] # 可视化工具
基本结构操作
from pymatgen.core import Structure, Lattice
# 从文件读取结构(自动格式检测)
struct = Structure.from_file("POSCAR")
# 从零创建结构
lattice = Lattice.cubic(3.84)
struct = Structure(lattice, ["Si", "Si"], [[0,0,0], [0.25,0.25,0.25]])
# 写入不同格式
struct.to(filename="structure.cif")
# 基本性质
print(f"化学式: {struct.composition.reduced_formula}")
print(f"空间群: {struct.get_space_group_info()}")
print(f"密度: {struct.density:.2f} g/cm³")
Materials Project集成
# 设置API密钥
export MP_API_KEY="your_api_key_here"
from mp_api.client import MPRester
with MPRester() as mpr:
# 通过材料ID获取结构
struct = mpr.get_structure_by_material_id("mp-149")
# 搜索材料
materials = mpr.materials.summary.search(
formula="Fe2O3",
energy_above_hull=(0, 0.05)
)
核心功能
1. 结构创建与操作
使用多种方法创建结构并执行变换。
从文件:
# 自动格式检测
struct = Structure.from_file("structure.cif")
struct = Structure.from_file("POSCAR")
mol = Molecule.from_file("molecule.xyz")
从零开始:
from pymatgen.core import Structure, Lattice
# 使用晶格参数
lattice = Lattice.from_parameters(a=3.84, b=3.84, c=3.84,
alpha=120, beta=90, gamma=60)
coords = [[0, 0, 0], [0.75, 0.5, 0.75]]
struct = Structure(lattice, ["Si", "Si"], coords)
# 从空间群
struct = Structure.from_spacegroup(
"Fm-3m",
Lattice.cubic(3.5),
["Si"],
[[0, 0, 0]]
)
变换:
from pymatgen.transformations.standard_transformations import (
SupercellTransformation,
SubstitutionTransformation,
PrimitiveCellTransformation
)
# 创建超胞
trans = SupercellTransformation([[2,0,0],[0,2,0],[0,0,2]])
supercell = trans.apply_transformation(struct)
# 替换元素
trans = SubstitutionTransformation({"Fe": "Mn"})
new_struct = trans.apply_transformation(struct)
# 获取原胞
trans = PrimitiveCellTransformation()
primitive = trans.apply_transformation(struct)
参考: 有关Structure、Lattice、Molecule及相关类的全面文档,请参见references/core_classes.md。
2. 文件格式转换
在100多种文件格式之间转换,支持自动格式检测。
使用便捷方法:
# 读取任何格式
struct = Structure.from_file("input_file")
# 写入任何格式
struct.to(filename="output.cif")
struct.to(filename="POSCAR")
struct.to(filename="output.xyz")
使用转换脚本:
# 单文件转换
python scripts/structure_converter.py POSCAR structure.cif
# 批量转换
python scripts/structure_converter.py *.cif --output-dir ./poscar_files --format poscar
参考: 有关所有支持的格式和代码集成的详细文档,请参见references/io_formats.md。
3. 结构分析与对称性
分析结构的对称性、配位等性质。
对称性分析:
from pymatgen.symmetry.analyzer import SpacegroupAnalyzer
sga = SpacegroupAnalyzer(struct)
# 获取空间群信息
print(f"空间群: {sga.get_space_group_symbol()}")
print(f"编号: {sga.get_space_group_number()}")
print(f"晶系: {sga.get_crystal_system()}")
# 获取传统/原胞
conventional = sga.get_conventional_standard_structure()
primitive = sga.get_primitive_standard_structure()
配位环境:
from pymatgen.analysis.local_env import CrystalNN
cnn = CrystalNN()
neighbors = cnn.get_nn_info(struct, n=0) # 位点0的邻居
print(f"配位数: {len(neighbors)}")
for neighbor in neighbors:
site = struct[neighbor['site_index']]
print(f" {site.species_string} 在 {neighbor['weight']:.3f} Å")
使用分析脚本:
# 全面分析
python scripts/structure_analyzer.py POSCAR --symmetry --neighbors
# 导出结果
python scripts/structure_analyzer.py structure.cif --symmetry --export json
参考: 有关所有分析功能的详细文档,请参见references/analysis_modules.md。
4. 相图与热力学
构建相图并分析热力学稳定性。
相图构建:
from mp_api.client import MPRester
from pymatgen.analysis.phase_diagram import PhaseDiagram, PDPlotter
# 从Materials Project获取条目
with MPRester() as mpr:
entries = mpr.get_entries_in_chemsys("Li-Fe-O")
# 构建相图
pd = PhaseDiagram(entries)
# 检查稳定性
from pymatgen.core import Composition
comp = Composition("LiFeO2")
# 查找成分对应的条目
for entry in entries:
if entry.composition.reduced_formula == comp.reduced_formula:
e_above_hull = pd.get_e_above_hull(entry)
print(f"能量高于凸包: {e_above_hull:.4f} eV/原子")
if e_above_hull > 0.001:
# 获取分解
decomp = pd.get_decomposition(comp)
print("分解为:", decomp)
# 绘图
plotter = PDPlotter(pd)
plotter.show()
使用相图脚本:
# 生成相图
python scripts/phase_diagram_generator.py Li-Fe-O --output li_fe_o.png
# 分析特定成分
python scripts/phase_diagram_generator.py Li-Fe-O --analyze "LiFeO2" --show
参考: 有关详细示例,请参见references/analysis_modules.md(相图部分)和references/transformations_workflows.md(工作流2)。
5. 电子结构分析
分析能带结构、态密度和电子性质。
能带结构:
from pymatgen.io.vasp import Vasprun
from pymatgen.electronic_structure.plotter import BSPlotter
# 从VASP计算读取
vasprun = Vasprun("vasprun.xml")
bs = vasprun.get_band_structure()
# 分析
band_gap = bs.get_band_gap()
print(f"带隙: {band_gap['energy']:.3f} eV")
print(f"直接带隙: {band_gap['direct']}")
print(f"是金属: {bs.is_metal()}")
# 绘图
plotter = BSPlotter(bs)
plotter.save_plot("band_structure.png")
态密度:
from pymatgen.electronic_structure.plotter import DosPlotter
dos = vasprun.complete_dos
# 获取元素投影态密度
element_dos = dos.get_element_dos()
for element, element_dos_obj in element_dos.items():
print(f"{element}: {element_dos_obj.get_gap():.3f} eV")
# 绘图
plotter = DosPlotter()
plotter.add_dos("总态密度", dos)
plotter.show()
参考: 有关详细信息,请参见references/analysis_modules.md(电子结构部分)和references/io_formats.md(VASP部分)。
6. 表面与界面分析
生成板片、分析表面和研究界面。
板片生成:
from pymatgen.core.surface import SlabGenerator
# 生成特定Miller指数的板片
slabgen = SlabGenerator(
struct,
miller_index=(1, 1, 1),
min_slab_size=10.0, # Å
min_vacuum_size=10.0, # Å
center_slab=True
)
slabs = slabgen.get_slabs()
# 写入板片
for i, slab in enumerate(slabs):
slab.to(filename=f"slab_{i}.cif")
Wulff形状构建:
from pymatgen.analysis.wulff import WulffShape
# 定义表面能
surface_energies = {
(1, 0, 0): 1.0,
(1, 1, 0): 1.1,
(1, 1, 1): 0.9,
}
wulff = WulffShape(struct.lattice, surface_energies)
print(f"表面积: {wulff.surface_area:.2f} Ų")
print(f"体积: {wulff.volume:.2f} ų")
wulff.show()
吸附位点查找:
from pymatgen.analysis.adsorption import AdsorbateSiteFinder
from pymatgen.core import Molecule
asf = AdsorbateSiteFinder(slab)
# 查找位点
ads_sites = asf.find_adsorption_sites()
print(f"顶部位点: {len(ads_sites['ontop'])}")
print(f"桥接位点: {len(ads_sites['bridge'])}")
print(f"空洞位点: {len(ads_sites['hollow'])}")
# 添加吸附物
adsorbate = Molecule("O", [[0, 0, 0]])
ads_struct = asf.add_adsorbate(adsorbate, ads_sites["ontop"][0])
参考: 有关详细信息,请参见references/analysis_modules.md(表面与界面部分)和references/transformations_workflows.md(工作流3和9)。
7. Materials Project数据库访问
通过程序化方式访问Materials Project数据库。
设置:
- 从https://next-gen.materialsproject.org/获取API密钥
- 设置环境变量:
export MP_API_KEY="your_key_here"
搜索与检索:
from mp_api.client import MPRester
with MPRester() as mpr:
# 按化学式搜索
materials = mpr.materials.summary.search(formula="Fe2O3")
# 按化学系统搜索
materials = mpr.materials.summary.search(chemsys="Li-Fe-O")
# 按性质筛选
materials = mpr.materials.summary.search(
chemsys="Li-Fe-O",
energy_above_hull=(0, 0.05), # 稳定/亚稳定
band_gap=(1.0, 3.0) # 半导体
)
# 获取结构
struct = mpr.get_structure_by_material_id("mp-149")
# 获取能带结构
bs = mpr.get_bandstructure_by_material_id("mp-149")
# 获取相图条目
entries = mpr.get_entries_in_chemsys("Li-Fe-O")
参考: 有关全面的API文档和示例,请参见references/materials_project_api.md。
8. 计算工作流设置
为各种电子结构代码设置计算。
VASP输入生成:
from pymatgen.io.vasp.sets import MPRelaxSet, MPStaticSet, MPNonSCFSet
# 松弛
relax = MPRelaxSet(struct)
relax.write_input("./relax_calc")
# 静态计算
static = MPStaticSet(struct)
static.write_input("./static_calc")
# 能带结构(非自洽)
nscf = MPNonSCFSet(struct, mode="line")
nscf.write_input("./bandstructure_calc")
# 自定义参数
custom = MPRelaxSet(struct, user_incar_settings={"ENCUT": 600})
custom.write_input("./custom_calc")
其他代码:
# Gaussian
from pymatgen.io.gaussian import GaussianInput
gin = GaussianInput(
mol,
functional="B3LYP",
basis_set="6-31G(d)",
route_parameters={"Opt": None}
)
gin.write_file("input.gjf")
# Quantum ESPRESSO
from pymatgen.io.pwscf import PWInput
pwin = PWInput(struct, control={"calculation": "scf"})
pwin.write_file("pw.in")
参考: 有关工作流示例,请参见references/io_formats.md(电子结构代码I/O部分)和references/transformations_workflows.md。
9. 高级分析
衍射图案:
from pymatgen.analysis.diffraction.xrd import XRDCalculator
xrd = XRDCalculator()
pattern = xrd.get_pattern(struct)
# 获取峰
for peak in pattern.hkls:
print(f"2θ = {peak['2theta']:.2f}°, hkl = {peak['hkl']}")
pattern.plot()
弹性性质:
from pymatgen.analysis.elasticity import ElasticTensor
# 从弹性张量矩阵
elastic_tensor = ElasticTensor.from_voigt(matrix)
print(f"体模量: {elastic_tensor.k_voigt:.1f} GPa")
print(f"剪切模量: {elastic_tensor.g_voigt:.1f} GPa")
print(f"杨氏模量: {elastic_tensor.y_mod:.1f} GPa")
磁性排序:
from pymatgen.transformations.advanced_transformations import MagOrderingTransformation
# 枚举磁性排序
trans = MagOrderingTransformation({"Fe": 5.0})
mag_structs = trans.apply_transformation(struct, return_ranked_list=True)
# 获取最低能量磁性结构
lowest_energy_struct = mag_structs[0]['structure']
参考: 有关全面的分析模块文档,请参见references/analysis_modules.md。
捆绑资源
脚本 (scripts/)
可执行Python脚本用于常见任务:
-
structure_converter.py: 在结构文件格式之间转换- 支持批量转换和自动格式检测
- 用法:
python scripts/structure_converter.py POSCAR structure.cif
-
structure_analyzer.py: 全面结构分析- 对称性、配位、晶格参数、距离矩阵
- 用法:
python scripts/structure_analyzer.py structure.cif --symmetry --neighbors
-
phase_diagram_generator.py: 从Materials Project生成相图- 稳定性分析和热力学性质
- 用法:
python scripts/phase_diagram_generator.py Li-Fe-O --analyze "LiFeO2"
所有脚本包含详细帮助:python scripts/script_name.py --help
参考 (references/)
全面的文档按需加载到上下文中:
core_classes.md: Element、Structure、Lattice、Molecule、Composition类io_formats.md: 文件格式支持和代码集成(VASP、Gaussian等)analysis_modules.md: 相图、表面、电子结构、对称性materials_project_api.md: 完整的Materials Project API指南transformations_workflows.md: 变换框架和常见工作流
当需要关于特定模块或工作流的详细信息时,加载参考。
常见工作流
高通量结构生成
from pymatgen.transformations.standard_transformations import SubstitutionTransformation
from pymatgen.io.vasp.sets import MPRelaxSet
# 生成掺杂结构
base_struct = Structure.from_file("POSCAR")
dopants = ["Mn", "Co", "Ni", "Cu"]
for dopant in dopants:
trans = SubstitutionTransformation({"Fe": dopant})
doped_struct = trans.apply_transformation(base_struct)
# 生成VASP输入
vasp_input = MPRelaxSet(doped_struct)
vasp_input.write_input(f"./calcs/Fe_{dopant}")
能带结构计算工作流
# 1. 松弛
relax = MPRelaxSet(struct)
relax.write_input("./1_relax")
# 2. 静态(松弛后)
relaxed = Structure.from_file("1_relax/CONTCAR")
static = MPStaticSet(relaxed)
static.write_input("./2_static")
# 3. 能带结构(非自洽)
nscf = MPNonSCFSet(relaxed, mode="line")
nscf.write_input("./3_bandstructure")
# 4. 分析
from pymatgen.io.vasp import Vasprun
vasprun = Vasprun("3_bandstructure/vasprun.xml")
bs = vasprun.get_band_structure()
bs.get_band_gap()
表面能计算
# 1. 获取体能量
bulk_vasprun = Vasprun("bulk/vasprun.xml")
bulk_E_per_atom = bulk_vasprun.final_energy / len(bulk)
# 2. 生成并计算板片
slabgen = SlabGenerator(bulk, (1,1,1), 10, 15)
slab = slabgen.get_slabs()[0]
MPRelaxSet(slab).write_input("./slab_calc")
# 3. 计算表面能(计算后)
slab_vasprun = Vasprun("slab_calc/vasprun.xml")
E_surf = (slab_vasprun.final_energy - len(slab) * bulk_E_per_atom) / (2 * slab.surface_area)
E_surf *= 16.021766 # 转换eV/Ų为J/m²
更多工作流: 有关10个详细工作流示例,请参见references/transformations_workflows.md。
最佳实践
结构处理
- 使用自动格式检测:
Structure.from_file()处理大多数格式 - 优先使用不可变结构: 当结构不应改变时,使用
IStructure - 检查对称性: 使用
SpacegroupAnalyzer减少到原胞 - 验证结构: 检查重叠原子或不合理的键长
文件I/O
- 使用便捷方法: 优先使用
from_file()和to() - 明确指定格式: 当自动检测失败时
- 处理异常: 将文件I/O包装在try-except块中
- 使用序列化: 用于版本安全存储的
as_dict()/from_dict()
Materials Project API
- 使用上下文管理器: 始终使用
with MPRester() as mpr: - 批量查询: 一次请求多个项目
- 缓存结果: 本地保存常用数据
- 有效筛选: 使用性质筛选器减少数据传输
计算工作流
- 使用输入集: 优先使用
MPRelaxSet、MPStaticSet而不是手动INCAR - 检查收敛性: 始终验证计算是否收敛
- 跟踪变换: 使用
TransformedStructure用于可追溯性 - 组织计算: 使用清晰的目录结构
性能
- 减少对称性: 尽可能使用原胞
- 限制邻居搜索: 指定合理的截止半径
- 使用适当的方法: 不同分析工具有不同的速度/准确性权衡
- 并行化可能时: 许多操作可以并行化
单位与约定
Pymatgen统一使用原子单位:
- 长度: 埃(Å)
- 能量: 电子伏特(eV)
- 角度: 度(°)
- 磁矩: 玻尔磁子(μB)
- 时间: 飞秒(fs)
需要时使用pymatgen.core.units转换单位。
与其他工具集成
Pymatgen无缝集成以下工具:
- ASE(原子模拟环境)
- Phonopy(声子计算)
- BoltzTraP(输运性质)
- Atomate/Fireworks(工作流管理)
- AiiDA(可追溯性跟踪)
- Zeo++(孔分析)
- OpenBabel(分子转换)
故障排除
导入错误: 安装缺失的依赖项
pip install pymatgen[analysis,vis]
API密钥未找到: 设置MP_API_KEY环境变量
export MP_API_KEY="your_key_here"
结构读取失败: 检查文件格式和语法
# 尝试明确指定格式
struct = Structure.from_file("file.txt", fmt="cif")
对称性分析失败: 结构可能有数值精度问题
# 增加容差
from pymatgen.symmetry.analyzer import SpacegroupAnalyzer
sga = SpacegroupAnalyzer(struct, symprec=0.1)
附加资源
- 文档: https://pymatgen.org/
- Materials Project: https://materialsproject.org/
- GitHub: https://github.com/materialsproject/pymatgen
- 论坛: https://matsci.org/
- 示例笔记本: https://matgenb.materialsvirtuallab.org/
版本说明
此技能设计用于pymatgen 2024.x及更高版本。对于Materials Project API,使用mp-api包(与旧版pymatgen.ext.matproj分开)。
要求:
- Python 3.10或更高
- pymatgen >= 2023.x
- mp-api(用于Materials Project访问)