北京基因组所(国家生物信息中心)宣布癌症单细胞表达图谱数据库CancerSCEM
克日,ibet(国家生物信息中心)国家基因组科学数据中心开发的癌症单细胞表达图谱数据库(CancerSCEM)正式上线。该研究效果以“CancerSCEM: a database of single-cell expression map across various human cancers”为题在国际学术期刊Nucleic Acid Research 在线揭晓。
单细胞区分率的全转录组测序手艺(scRNA-seq)具有研究细胞异质性的显著优势,已成为研究肿瘤微情形、癌症发病机制、转移与侵袭以及种种癌症治疗与诊断不可或缺的手段。阻止2021年11月,PubMed已有凌驾1300个癌症相关的单细胞转录组学研究,极大提升了我们对人类癌症爆发生长的明确,推动了癌症临床诊断与治疗的历程。大规模癌症scRNA-seq数据在已往十年中泛起爆炸式增添,迫切需要对这些数据举行规范化整合与处置惩罚,对种种癌症的肿瘤微情形举行深入挖掘与较量剖析。为应对这一需求,国家基因组科学数据中心研究团队开发了CancerSCEM数据库。
CancerSCEM 1.0版本整合剖析了208个癌症scRNA-seq数据集,涵盖肺腺癌(LUAD)、结肠直肠癌(CRC)、恶性胶质瘤(GBM)等在内的20种人类癌症类型。通过标准化剖析流程处置惩罚,获得了准确的细胞类型注释信息。在此基础上,团队还开展了一系列附加剖析,包括差别细胞类型间基因差别表达剖析(可为新型标记物筛选提供参考)、细胞外貌受体-配体基因对表达谱、样本内细胞互作网络构建等,可为用户提供越发富厚的肿瘤微情形相关信息,并开展了基于TCGA表达数据与临床信息的生涯剖析。
数据库为用户提供浏览、多重检索、在线剖析及下载等效劳功效,用户可接纳首页的快速检索、词云及准确检索等途径盘问感兴趣的癌症单细胞数据集或样本。如点击词云里的基因名“HLA-A”或通过搜索框输入,均可触发数据库盘问功效,并实时获得目的基因的详细信息及其在单细胞层面与细胞群体(组织)层面的表达漫衍信息。为利便临床相关用户的使用,团队共审编获得36个常用免疫检查点分子(如PDCD1、CTLA4、LAG3、HMGB1等)并提供专门的搜索列表,以资助种种癌症的临床免疫治疗研究寻找更优的治疗靶点。
数据库还配备了一个交互式综合在线剖析平台,共集成2个剖析?橛7个剖析功效。通过基因剖析?,用户可开展四个方面的实时剖析及可视化展示:1)样本内目的基因的整体表达概况;2)样本内基因在差别细胞类型间的表达较量;3)基因表达相关性盘算及筛;4)208样本中单细胞或bulk层面的基因表达较量。通过样天职析?,用户可举行1)样本间细胞组成较量;2)样本内细胞互作网络构建以及3)基于TCGA的生涯剖析。该剖析平台将为用户开展个性化的癌症scRNA-seq数据挖掘提供友好的增值效劳。
ibet(国家生物信息中心)助理研究员曾瀞瑶、特殊研究助理张亚东及硕士研究生尚云飞为本事情配合第一作者,肖景发研究员为通讯作者。本事情获得中科院战略性先导科技专项、国家自然科学基金、国家重点研发妄想等项目资助。

CancerSCEM数据库在线剖析平台的7个剖析功效展示
文章链接






