Rosetta@home

技术新闻

  UW Seal
 
[ 主页 ] [ 参与 ] [ 关于 ] [ 您的帐号 ] [ 社群相关 ] [ 统计资料 ]
 

[ 登陆/退出 ]


技术新闻用来解释项目服务器运作过程中遇到的各种技术问题,以及我们代码开发研究的进展。

2006年3月28日
Rom Walton 通过升级 BOINC 接口修复了“被抢占时移出内存”臭虫,方法是在关闭计算程序时由 exit 改用 TerminateProcess,这样就是由 BOINC 在计算进程退出后进行清理工作,而不是计算程序自己来进行清理。针对其它如“计算程序僵在 1% 进度”臭虫,我们增加了新的调试信息。Windows 用户可能通过下载计算程序的数据库文件来帮助我们搜寻这些臭虫。数据库文件的下载网址是:http://boinc.bakerlab.org/rosetta/download/rosetta_X.XX_windows_intelx86.pdb,其中 X.XX 是最新的版本号。下载后请放置在 BOINC/projects/boinc.bakerlab.org_rosetta 文件夹。目前出于网络带宽的限制,我们并没有将这个数据库文件打包在计算程序中。该数据库文件提供了附加的调试信息。我们相信有了 Rom 的帮助和用户们的反馈,我们很快就能找到并修正 rosetta 中残留的问题并进一步减少项目的错误率。

2006年3月22日
最近我们的数据库服务器多次死机,导致网站变慢。问题很难解决。今天上午我们注意到每次变慢的时候都有人正在进行合并计算的操作。在排除了其它所有可能性之后,我们怀疑是不是合并计算机的操作有问题。在多次无用的搜寻之后,我们发现 SETI@home 项目上个月也碰到了这个问题(详情请看 SETI@home 项目2月1日的技术新闻)。因此我们已经禁用了合并计算机的功能,直到我们对数据库软件进行升级。

2006年2月22日
太平洋时间今天早上8点20开始,整个学校的网络都出了问题,相关人员正在解决。

2006年2月17日
今天我们对数据库进行了备份,并将数据库的服务器软件升级成了 mysql-max,而硬件上使用了由 14 块硬盘组成的 RAID10。

2006年2月14日
我们修改了网站服务器以解决连接困难的问题,应该已经起作用了。

2006年1月17日
太平洋时间今天下午三点将停机进行维护。停机时间将可能比以往的更长,因为除了备份数据库以及优化数据表,我们还要将项目文件移动至文件服务器上。

2006年1月13日
今天华盛顿大学全校的网络出了问题,原因是最近 Windows 的 WMF 漏洞。详细请看这里

2006年1月12日
我们之前已声明将授予那些运行并中止了12月20日分发的错误任务的用户相应积分。最后,所有被中止或出错的批号 205 的任务以及那些错误的随机数种子相关的任务的结果都被授予了积分。来自这些结果的“申请积分”都被增加到了数据库中相应用户、主机、团队的总积分上。总共有 274609.56 的积分被授予。如何你想了解详细的情况(具体的用户、主机、团队及授予的积分),请看如下列表(大小为 4.2MB):available online (4.2M)

2006年1月6日
太平洋时间今天下午三点的例行维护中我们将备份数据库并优化数据表。我们还将替换一个更健壮的数据文件服务器。我们原来的文件服务器使用的是由 5 个 146G 的 Ultra3 SCSI 硬盘组成的一个逻辑卷。其中一个硬盘的问题导致整个逻辑卷不再安全。新文件服务器的配置是双 2.8G 至强和 2G 内存以及由 6 个 146G 硬盘组成的 RAID5 以提供冗余。

2005年12月20日
昨晚我们针对所有平台发布了新版本的计算程序。升级带来的变化主要是增加搜寻的多样性。对于熟悉 Rosetta 的用户,新程序可以使用更大的蛋白质片段库并运行更多周期。图形也进行了小的修改以允许对自然的结构进行旋转。

另外,我们实验室的一位博士后 Bin 发现并修复了一个软件中的臭虫,这个臭虫有可能导致“1%”问题(无限循环)。这个臭虫会在特定的情形下很偶尔发生。我们还不确定这是不是导致“1%”问题的唯一臭虫。

我们还正式使用了新的批量任务提交系统。不幸的是,有一批使用这个系统的任务设置错误。这批任务的名称以“DEFAULT_xxxxx_205_”开头,其中的 xxxxx 是蛋白质代码和链标识,205 是批号。

如果你正在运行这些任务,请直接中止它们。批号 206 以及之后的任务都是正常的,不需要中止。

批号 205 的任务包被设置成预测 1000 个而不是 10 个结构,因此它们的运行时间将超过 12 到 16 小时的限制,最终都将报错。但对于已经运行并中止这些任务的用户,我们仍将授予相应的积分。

另外一个引发“0xc0000005 UNHANDLED EXCEPTION”错误的问题也已被确定。这个奇怪的臭虫似乎依赖于随机数种子,我们正在试图找出其原因。一个临时的修复已经准备好了,它将使用计算机时钟来产生这个种子。

为了防止以后类似的错误,我们搭建了一个供本地测试用的 BOINC 服务器并将在假期后进行质量控制工作。

2005年12月12日
任务生成服务最近很难跟上所有客户端请求任务的速度。一个临时的解决方法是优化数据库表(就像以前做的)。我们将在今天下午三点进行优化并对数据库进行备份。如前所述,我们将会升级我们的服务器以解决这个问题。

2005年11月27日
欢迎来到技术新闻页面!

今天我们按照 SETI 项目的配置对我们的数据库进行了备份和重新配置。感谢 SETI 项目的数据库管理员 Bob Bankay 和 Einstein 项目的 David Hammer 提供了有用的建议和他们的 my.cnf 文件的复件。很快我们将在由 Keith 搭建的两台测试服务器(64 位双皓龙,8G 内存)上测试数据库复制。如果测试结果良好,将正式使用。使用数据库复制的好处(请参考 MySQL 的文档)有:增强服务器的健壮性(主服务器停机时可以使用备用服务器),对非更新的查询类型的负载均衡,不中断的服务器维护(比如数据库备份)。


主页 | 参与 | 关于 | 您的帐号 | 社群相关 | 统计资料

Copyright © 2005 University of Washington
回到顶部 ^