The news items below address various technical aspects of our research.
2006年1月25日
以后我将每半个月对近期的结果和接下来的计划进行一次说明。
今天我将概述一下前面几个星期的主要结果。
-
更多的计算资源可以得到更好的结果。这个可以从
1ogw 实验中看出。比如“NO_SIM_ANNEAL_BARCODE_30”任务类型,我们运行了
60,000 个独立的任务,总共得到 600,000 个结构。其中能量最低的十个结构的平均
RMSD 为 2.86。如果我们仅从前面 18,000 个任务中提取能量最低的十个结构,平均的
RMSD 则为 4.49。也就是说采样越多,接近真实结构(全局能量最低)的采样也就越多,最后得到的结果也就越精确。
-
给蛋白质链更多的自由度也能得到更好的结果(这就是我在几个月前所描述的“突破性进展”)。在“NO_VARY_OMEGA”任务类型中,我们限制了链的自由度(就像取得“突破”之前),结果都变差了。比方说,在
1ogw 实验中,最低能量结果的 RMSD 提高到了 4.50。在 1r69 实验中,最低能量结构的
RMSD 从 1.29 提高到了 2.80。
-
计算量更少的“NO_SIM_ANNEAL"方法在寻找低能量低
RMSD 的结构方面并不比“SIM_ANNEAL”方法差。这是一个好消息,因为我们能够运行更多的“NO_SIM_ANNEAL”任务,同样的计算时间,可以进行更多的搜寻。
-
正如 Paul Buck
期望的,其它大部分我们测试过的方法大体上效果都差不多(除了“NO_VARY_OMEGA”)。也可以这样看,对于我们要搜寻的巨大空间,重要的是有多少探索者被送出去搜寻,具体我们怎么指导探索者去搜寻反而并不那么重要。
-
令人激动的是,对于大部分蛋白质,我们预测的最低能量结构都与真实结构相当接近(RMSD
小于 3 埃)。比如在“NO_SIM_ANNEAL_BARCODE_30”任务类型中,各个蛋白质的最低能量结构的
RMSD 分别是:
1dtj:
|
1.93
|
1dcj:
|
2.72
|
1ogw:
|
2.65
|
2reb:
|
1.46
|
1r69:
|
1.79
|
1di2:
|
1.40
|
这些结果和之前的任何结果比较都是一个相当大的进步。如果我们能够对于这种大小的蛋白质一直得到这样的结果,这将是一个很大的科学进展。
下一步,我们将对 25 种新的蛋白质测试“NO_SIM_ANNEAL_BARCODE_30”方法的计算效率。你将在屏保上看到之前从未看到过的新蛋白质。名称中的“BARCODE_30”表示的是在计算开始时,在蛋白质中以
30 个氨基酸为单位,随机选择一个基的偏转角度。这将产生空间中的不同的搜寻区域,就好比把探索者降落到不同的经纬度。
在接下来的几个星期,你还将看到更多的“PRODUCTION_AB_INITIO”任务。这些任务用来测试搜寻的第一个阶段(低分辨率搜寻)。我们将减少任务包中的轨迹数以避免
max_cpu_time 问题。我想我们已经基本解决了这个问题,一方面减少任务包的长度,另一方面将
max_cpu_time 限制增加了一倍。
之后也将有一些在我们网站介绍部分所描述的一些项目的测试计算。我们希望不久后就能在
BOINC 上运行疫苗设计的计算任务。在此回答留言板的一些帖子,我们还没有进行糖尿病或多发性硬化症相关的工作,但是如果能够使用你们帮助我们开发的计算方法来更好地预测和这些疾病相关的蛋白质的结构,这也会对研究这些疾病的人员有帮助的。
谢谢所有用户的无私贡献!
David Baker
|