1. 前言
本教程讲述如何使用殷赋云平台的【小分子虚拟筛选(Vina)】方案和相关小工具,对大型化合物库进行小分子苗头化合物的虚拟筛选。
2. 流程图
graph LR A(准备受体三维结构) --> B(虚拟筛选) B(虚拟筛选) --> C(分析结果)
3. 结构信息
受体蛋白:人Serine/threonine-protein kinase B-raf蛋白,uniprot AC号:P15056,PDB编号:5ITA
化合物库:平台自带的Enamine HTS库(约175万个化合物)
4. 平台操作步骤
4.1 准备受体三维结构
-
打开殷赋云平台(https://cloud.yinfotek.com/)【处理PDB结构】小工具;
-
输入PDB编号5ITA,点击【确定】;
-
删除多余结构(水分子),保留蛋白和共晶配体;
该晶体结构为同源二聚体,含有A、B两条链,各包含一个共晶配体。我们保留A链蛋白和配体,删除B链结构和所有水分子,如下图所示。
- 点击【准备】,下载文件。
4.2 虚拟筛选
-
打开殷赋云平台【小分子虚拟筛选(Vina)】大方案,创建任务,进入提交任务页面;
-
上传受体文件,选择化合物库或上传配体文件;
上传的配体文件须为处理好的三维结构,化合物数量须介于1~2万(含)。若小于1万,请使用【小分子虚拟筛选(DOCK 6.9)】方案。
-
上传共晶配体或位点文件,设置盒子大小,点击【显示盒子】;
稍等片刻,即返回盒子中心、盒子大小数据和图形。若盒子过小,调整后再试。
-
根据需要,勾选或取消小样本测试,然后点击【提交】任务。
小样本测试是从化合物库中随机抽取5120个化合物进行测试,由此可了解所设置的盒子是否合适、对接打分分布如何,比较多个化合物库的结构多样性和打分情况。
4.3 结果分析
-
待任务完成,点击【查看】,进入分析页面;
-
查看苗头化合物的打分数据表和分布直方图,下载文件;
Affinity为对接打分,该值越小结合力越强。
该表给出前100个打分最好的苗头化合物,表格下方文件包含全部(Affinity <= -7.0 kcal/mol)分子结构和打分数据。
平台还给出全部结果的打分分布频率直方图,可直观了解整体打分的分布情况。
如果是小样本测试,可根据分布图,选择合适的化合物库。例如,如果整体打分数值偏大,可能意味着该库不太适合该体系,可选择多个库中相对较好者。
-
查看相互作用,分析结合模式或挑选苗头化合物;
- 该页面给出前100个结果的结合模式;
- 右侧可调整视图样式,右下角可切换化合物和构象。
-
挑选结果。设置过滤条件,点击【确定】。
- 若返回出错提示,表示无符合条件的化合物,可调整过滤条件再试;
- 最终结果为各条件的并集,即条件越多,符合条件的越少;
selected-1000.sdf
中的1000
表示该文件包含1000个化合物。- 在实际筛选时,建议挑选1000-10000个化合物,然后使用DOCK 6.9方案做进一步筛选。