当前位置：首页 > news >正文

从PDB文件到对接结果：用AutoDock Vina跑通你的第一个药物分子对接（附完整脚本）

news 2026/6/8 23:22:29

从PDB文件到对接结果：AutoDock Vina药物分子对接全流程实战指南

药物分子对接是计算机辅助药物设计中的核心环节，而AutoDock Vina凭借其开源免费、计算高效的特点，已成为科研工作者探索分子相互作用的利器。本文将带你从零开始，用1OYT蛋白与配体作为案例，完整走通从PDB文件下载到对接结果分析的全流程，并提供可直接复用的自动化脚本。

1. 环境准备与工具安装

在开始分子对接前，需要配置好必要的软件环境。AutoDock Vina本身只负责对接计算，预处理环节需要借助其他工具完成。以下是推荐的工具链组合：

AutoDock Vina 1.2.3：核心对接引擎
MGLTools 1.5.7：用于受体和配体的pdbqt格式转换
Open Babel 3.1.1：备用的格式转换工具
PyMOL 2.5：可视化与结构检查（可选但推荐）

1.1 一键安装脚本

对于Ubuntu/Debian系统，可以使用以下脚本快速安装所需工具：

#!/bin/bash # 安装依赖库 sudo apt-get update sudo apt-get install -y wget tar bzip2 # 安装AutoDock Vina wget https://github.com/ccsb-scripps/AutoDock-Vina/releases/download/v1.2.3/vina_1.2.3_linux_x86_64 chmod +x vina_1.2.3_linux_x86_64 sudo mv vina_1.2.3_linux_x86_64 /usr/local/bin/vina # 安装Open Babel sudo apt-get install -y openbabel # 安装MGLTools wget https://ccsb.scripps.edu/mgltools/downloads/2021-2-1/mgltools_x86_64Linux2_1.5.7.tar.gz tar -xzf mgltools_x86_64Linux2_1.5.7.tar.gz cd mgltools_x86_64Linux2_1.5.7 ./install.sh

提示：安装完成后建议将MGLTools的bin目录加入PATH环境变量，方便后续调用。

2. 数据获取与预处理

2.1 从PDB数据库获取目标结构

我们以1OYT（HIV-1蛋白酶与抑制剂复合物）为例，演示完整流程。使用以下Python脚本可自动下载并拆分复合物：

import requests from biopandas.pdb import PandasPdb # 下载1OYT结构 url = "https://files.rcsb.org/download/1OYT.pdb" response = requests.get(url) with open("1OYT.pdb", "wb") as f: f.write(response.content) # 拆分受体和配体 ppdb = PandasPdb().read_pdb("1OYT.pdb") ligand_df = ppdb.df["HETATM"][ppdb.df["HETATM"]["residue_name"] == "FSN"] receptor_df = ppdb.df["ATOM"] # 保存拆分后的文件 ppdb.to_pdb(path="1OYT_receptor.pdb", records=["ATOM"]) ligand_df.to_pdb("1OYT_ligand.pdb")

2.2 受体预处理关键步骤

受体预处理的目标是生成适合对接的pdbqt文件，主要步骤包括：

去除水分子和无关配体：保留目标蛋白结构
添加氢原子：补充蛋白结构中缺失的氢原子
计算电荷：分配适合对接的原子电荷
格式转换：将PDB转为pdbqt格式

使用MGLTools的自动化脚本：

#!/bin/bash # 受体预处理 prepare_receptor4.py -r 1OYT_receptor.pdb -o 1OYT_receptor.pdbqt -A checkhydrogens -U nphs_lps_waters_nonstdres

关键参数说明：

-A checkhydrogens：自动检查并添加缺失的氢原子
-U nphs_lps_waters_nonstdres：去除水分子、非标准残基等

2.3 配体预处理方案对比

配体预处理有两种主流方案，各有优缺点：

工具	优点	缺点	适用场景
MGLTools	处理精细，支持柔性键定义	速度较慢，依赖Python环境	需要精确控制配体柔性
Open Babel	转换速度快，命令行简单	不支持柔性键设置	快速批量处理刚性配体

MGLTools处理示例：

prepare_ligand4.py -l 1OYT_ligand.pdb -o 1OYT_ligand.pdbqt -A hydrogens

Open Babel快速转换：

obabel 1OYT_ligand.pdb -O 1OYT_ligand.pdbqt -xr

3. 对接参数配置实战

3.1 对接盒(Box)的确定技巧

对接盒定义了配体可能的结合区域，其参数包括中心坐标(box center)和盒子尺寸(box size)。确定对接盒的三种实用方法：

已知配体位置法（推荐）：

# 使用原始复合物中的配体位置确定中心 from biopandas.pdb import PandasPdb ppdb = PandasPdb().read_pdb("1OYT.pdb") ligand_coords = ppdb.df["HETATM"][["x_coord","y_coord","z_coord"]].mean().values print(f"center_x = {ligand_coords[0]:.3f}") print(f"center_y = {ligand_coords[1]:.3f}") print(f"center_z = {ligand_coords[2]:.3f}")

PyMOL可视化选取：
- 在PyMOL中加载受体结构
- 使用get_view命令获取当前视角中心
- 手动调整到目标区域后记录坐标
在线工具预测：
- 使用PocketFinder等在线服务预测可能的结合位点

3.2 配置文件模板与参数解析

创建config.txt文件，包含以下核心参数：

# 对接盒参数 center_x = 17.057 center_y = -6.468 center_z = 23.461 size_x = 20 size_y = 20 size_z = 20 # 搜索参数 exhaustiveness = 32 num_modes = 10 energy_range = 5

关键参数优化建议：

size取值：一般20-30Å，覆盖整个结合口袋
exhaustiveness：默认8，提高可增加搜索强度但耗时更长
num_modes：建议保留5-10个构象用于分析

4. 自动化对接与结果分析

4.1 一键对接脚本

整合前述步骤的完整Bash脚本：

#!/bin/bash # 自动对接脚本 PDB_ID="1OYT" # 步骤1：下载并处理结构 python3 fetch_pdb.py $PDB_ID # 步骤2：预处理受体 prepare_receptor4.py -r ${PDB_ID}_receptor.pdb -o ${PDB_ID}_receptor.pdbqt -A checkhydrogens # 步骤3：预处理配体 prepare_ligand4.py -l ${PDB_ID}_ligand.pdb -o ${PDB_ID}_ligand.pdbqt -A hydrogens # 步骤4：运行对接 vina --receptor ${PDB_ID}_receptor.pdbqt \ --ligand ${PDB_ID}_ligand.pdbqt \ --config config.txt \ --out ${PDB_ID}_result.pdbqt \ --log ${PDB_ID}_log.txt

4.2 结果解读与可视化

对接完成后，主要关注三个输出文件：

result.pdbqt：包含对接构象及其能量评分

REMARK VINA RESULT: -9.1 0.000 0.000 REMARK VINA RESULT: -8.7 1.234 0.789 ...

log.txt：记录详细对接过程与参数
结合模式分析：
- 使用PyMOL比较对接构象与晶体结构
- 分析关键相互作用（氢键、疏水作用等）

PyMOL分析命令示例：

load 1OYT_receptor.pdbqt load 1OYT_result.pdbqt align 1OYT_ligand, 1OYT_result

4.3 性能优化技巧

对于大规模对接任务，可采用以下优化策略：

并行计算：利用Vina的--cpu参数多核并行
批量处理：编写Python脚本自动化处理分子库
参数调优：适当降低exhaustiveness加速筛选

# 多配体批量对接示例 import subprocess ligands = ["lig1.pdbqt", "lig2.pdbqt", "lig3.pdbqt"] for lig in ligands: cmd = f"vina --receptor receptor.pdbqt --ligand {lig} --config config.txt" subprocess.run(cmd, shell=True)

在实际项目中，建议先用小规模测试验证参数合理性，再扩展到大规模计算。对接结果应结合实验数据交叉验证，避免过度依赖计算预测。

查看全文

http://www.cnnetsun.cn/news/2833712.html