基因组热潮过后转录物组逐渐受到青睐
今年5月,首届人类基因组科学大会(The First Waterfront Symposium of Human Genome Science,WASH)在日本东京召开,120名来自世界各地的研究者聚集一堂,开始共同构建转录物组(transcriptome)数据库的框架,他们希望有朝一日这个数据库能够收录人类基因组中所有的基因表达序列。据本次大会的组织者介绍,这个数据库将在今年12月建成启用,并且将向全世界所有从事生物学研究及新药研发的工作者开放。此数据库的运作将由日本生物学信息研究中心(JBIRC)和日本DNA数据库(DDBJ)共同负责。
目前,大多数cDNA的数据都已经可以从各种公开的数据库中获得,但是其中有许多还不是完整的cDNA,而只是cDNA片段。另外,这些数据仍然存在着许多缺陷,例如有些数据没有进行正确的分类,来源于不同数据库的数据之间可能存在不一致的地方等等。cDNA数据的这些缺陷阻碍了它们在研究中的实际应用。因此,科学家们一直希望能够将所有收集到的人类cDNA序列加以整理,并收录到同一个数据库中,这样,科研人员的工作就可以更加规范和准确了。在本次东京大会上,学者们对2万多条基因的cDNA数据(占整个转录物组的一半以上)进行了分析,以初步确定数据库的入选标准和内容。
目前,研究人员从人类基因组中寻找基因,通常的做法是在整个基因组序列中查找特定的碱基序列,并由此推测这一片段的可表达性。这一预测的过程一般都会或多或少地带有误差。不过,如果研究人员是通过cDNA来完成这项工作,那就会使操作步骤变得更加简单、准确。本次会议的组织者,DDBJ的主任Takashi Gojobori 说:“转录物组数据库将是真正的人类基因的汇,因为库中的数据不是利用推测的手段从人类基因组序列中获得的,它们都是真正的人类基因的转录产物。”美国俄亥俄州Cincinnati大学医学中心的基因组信息部主任Ranajit Chakraborty说:“100多名科学家将对所有这些收集到的cDNA数据进行核查,并有针对性地加以取舍,以保证这些数据的准确性。