gnina分子对接 | lyy 个人博客

type

status

date

slug

summary

1. 安装依赖库文件

2. 安装openbabel3

配置环境变量

测试

3. libmolgrid编译安装

进入虚拟环境

配置libmolgrid环境变量

4. gnina编译安装

又下载了libtorch（此处省略）

总的环境变量

如何批量操作实践

加氢

针对受体蛋白，gnina不会自动添加氢原子，因为蛋白结构复杂，氢原子位置依赖pH值、残基状态等。可以提前用H++进行处理，或者简单点直接用DS处理。针对配体小分子，--addH 参数默认是True，所以默认给小分子添加氢原子，配体不用提前做加氢原子处理。

将文件夹中所有sdf文件名写入到一个txt中

批量处理脚本

赋予执行权限

创建输出文件夹。

修改路径。

执行

结果

成功结合在配体附近

rescore和refinement对比

参数 --cnn_scoring rescore结果：

Using random seed: 42

0% 10 20 30 40 50 60 70 80 90 100% |----|----|----|----|----|----|----|----|----|----|

| pose 0 | initial pose not within box

参数--cnn_scoring refinement结果：

0% 10 20 30 40 50 60 70 80 90 100% |----|----|----|----|----|----|----|----|----|----|

可见设置--cnn_scoring refinement有多个pose。设置--cnn_scoring rescore只有一个参数，速度快。

批量提取对接信息写入csv

全局对接

找蛋白中心

搜索框尺寸（--size_x/y/z）：需要足够大以覆盖整个受体。可以通过计算受体坐标的最大和最小值来确定：

我全局对接，第一次结果和第二次不一样？太奇怪了。第一次好多对接在距离蛋白很远的位置。我严重怀疑结果有问题，就又对接一次，参数也没改，结果这次都接在了蛋白上。有说法。

第二天：有说法个屁，我傻逼了，用错了，对接中心选错了，难怪会飞。选对对接盒子之后，全局对接没有任何问题。

用VMD算集合中心

set sel [atomselect top all] set center [measure center $sel] puts "Protein geometric center: $center"

啊啊啊啊啊又发现个问题，github上usage直接就写了，全局对接，

To perform whole protein docking:

直接把对接盒子--autobox_ligand设置成蛋白rec.pdb即可，艹。

参数注释

参数：docking_with_gnina slides

常用参数

smina是vina的fork，gnina是smina的fork。

gnina的好多参数是和smina一样的，可以参考smina。

下载预编译的二进制文件

又发现一个问题，之前的clone源代码进行编译，没毛病，但并不是唯一的方法。原来还可以下载预编译的二进制文件，打包了很多依赖，也不用自己再下载，节约时间。其实人家在Installation也说了：We recommend that you use the pre-built binary unless you have significant experience building software on Linux, in which case building from source might result in an executable more optimized for your system.

如何判断是支持linux还是windows运行的：

Releases 页面的Assets 部分一般会说明，一般都是linux，除非exe或者特殊说明。

靠一个更简单的方法，直接在colab运行，人家已经弄好了An example colab notebook showing how to use gnina is available here. 适用小任务快速对接。不过批量处理还是建议在本地。

这个学习好使3天半，净时间可能10个小时，包括写这个博客的时间，不过现在再让我做可能10分钟就能跑，也是进步。。。。。。吧。

参考资料

编译安装卷积神经网络算法分子对接软件-gnina的编译安装-CSDN博客

使用案例：分子对接软件gnina主要功能与使用案例-CSDN博客

GitHub：