北京基因组研究所(国家生物信息中心)原始数据治理系统(GSA Family)研发取得新希望
8月14日,ibet(国家生物信息中心)国家基因组科学数据中心(CNCB-NGDC)在国际学术期刊Genomics,Proteomics & Bioinformatics在线揭晓题为“The Genome Sequence Archive Family: Toward Explosive Data Growth and Diverse Data Types”的文章,GSA数据库系统接受全天下科研事情者的数据提交,汇交和治理种种类型的数据,并对所有果真可用数据提供免费开放会见,支持生命科学研究。
组学原始数据归档库(GSA)是生命组学原始测序数据治理的公益性数据库,旨在推动全球生命组学数据的共享与应用。近年来,随着组学数据的爆炸性增添和数据类型的多样化,以及人类遗传资源数据治理的特殊需求,CNCB-NGDC对GSA数据库举行了更新和扩展,形成了GSA数据库系统,包括GSA,GSA-Human和OMIX。
GSA数据库与2017宣布的版内情比,在数据模子、系统功效和数据提交方法等方面举行了更新和功效提升;GSA-Human是存储人类遗传资源数据的数据库,可实现人类遗传资源数据的受控会见,包管人类遗传资源数据的清静性;OMIX数据库存储非原始测序数据,如情形组、表型组、代谢组等,它作为上述两种数据资源库的主要增补,有用地解决了用户提交除原始测序数据外的其它类型数据的需求。
阻止2021年8月14日,GSA和GSA-Human已网络的数据量抵达9.5 PB,OMIX上线不久数据量已抵达1.6 TB。GSA数据库系统已为全球111个国家/地区的用户提供数据效劳,平均天天的数据下载量抵达4 TB,已成为Elsevier、Wiley、 Taylor & Francis 、Cell及 Springer Nature出书集团指定的核酸数据归档库,获得领域内所有海内外主流期刊的认可。
北京基因组所(国家生物信息中心)国家基因组科学数据中心的陈婷婷、陈旭、张思思、朱军伟工程师为该文配合第一作者,王彦青高级工程师、章张研究员、赵文明正高级工程师为该文配合通讯作者。
本研究获得了国家重点研发妄想、中科院战略先导专项、ibet信息化专项等项目的支持,GSA归档数据使用的盘算机硬件设施获得国家财务部修缮购置专项的恒久支持。

GSA Family数据模子
论文链接






