登陆注册
36109

先心病基因库构建成功(阜外医院周洲与南京大学叶鹰团队合作)

杨进刚阜外杨进刚阜外2023-09-29 14:05:390

总之,CHDbase将持续定期更新,为先心病领域的研究者和临床医生提供宝贵资源,推动先心病基础研究和临床发现。

为帮助研究者了解先心病基因功能和遗传变异致病性,进一步整合约50个数据库和工具,对纳入基因和变异进行了详细的功能注释。

对每一项证据,CHDbase全面获取包含文献、受试者、研究策略、研究方法和主要研究结果等多元信息。

最后,基于CHDbase中的基因–表型相关性数据,作者对27种先心病进行了分子分型。

近日,中国医学科学院阜外医院周洲教授与南京大学叶鹰教授等构建了CHDbase数据库,收集并整理了1992~2020年发表的先心病研究,共整合约150种先心病及160种相关综合征的1124个易感基因及3591个遗传变异,构建了全面开放的先心病基因表型知识库,并提供了强大的检索和浏览界面供用户使用。

CHDbase的构建

首先采用Jaccard系数来测量两两先心病之间的基因相似性(图6A)。进一步采用层次聚类把27种先心病归为以下七类:右心室流出道梗阻(RVOTO)、左心室流出道梗阻(LVOTO)、左右排布异常(Left-right abnormality)、三尖瓣异常(Tricuspid valve abnormality)、法洛四联症(TOF)、房室管和间隔异常(Atrioventricular canal and septal abnormality)和流出道畸形(Outflow tract malformations)(图6B)。

转载:请标明“中国循环杂志”很多疑难复杂病例,一个医生一生也只能见到一次

作者通过关键词在PubMed搜索获取的先心病遗传学论文,主体框架如图1所示。

图3 先心病核心基因网络

图2 CHDbase用户界面结构图

此结果,与之前解剖学、胚胎学和家系共患病分类方法一致性较高,文中也对具体差异进行了详细分析。

数据库链接:。

为了评估各基因在先心病发病中的重要性,作者采用基因–基因相互作用数据对1124个基因进行网络构建,并使用三种网络中心度,即度中心度(Degree centrality)、中介中心度(Between centrality)和特征向量中心度(Eigenvector centrality)来衡量基因在CHD网络中的重要性。

随后,作者对先心病基因进行了功能富集分析。如图5A,先心病基因在心脏发育、胚胎形态发生 (Embryonic morphogenesis)、模式形成过程(Pattern specification process)、细胞分化、肌肉结构发育、细胞组分运动的调节(Regulation of cellular component movement)和细胞表面受体信号通路等GO条目上显著富集。

为了促进先心病遗传学研究和机制研究,作者系统分析了先心病基因的表达特征。由于综合征型先心病通常伴发大脑发育异常,文中同时探索了不同先心病基因集合在人脑和心脏中不同发育时间点的表达变化。

图1 CHDbase框架

图4所示,三类先心病基因在胚胎时期表达水平都高于背景基因,且综合征型基因在大脑中的表达水平高于非综合征型基因(图4A),而在心脏中显著低于非综合征型基因(图4B),表明先心病基因对胚胎发育至关重要且不同类型的基因与其特征表型所在组织高度相关。

为了更好地呈现数据库信息并帮助研究者快速定位和有效利用相关数据,CHDbase提供了开放友好的用户界面,包含对“基因”、“变异”、“疾病”和“文献”的关键字搜索搜索(图2A和2B),基于浏览表的多关键字排序和高级搜索(图2C),基因/变异与先心病相关性的详细证据呈现(图2D)、详尽的统计信息(图2E)和帮助文档(图2F)。

在CHDbase中,共有1124个基因被报道与先心病易感性相关,其中115个基因只在综合征型患者中有报道,597个基因只在非综合征型患者中有报道,其余412个基因在两类患者中均有报道。

在通路水平上,参与心脏发育的细胞表面受体信号通路,如Wnt、Notch和TGF-β信号通路同样富集(图5B)。值得注意的是,前几位显著性通路中涉及多种癌症信号通路,这为理解先心病患者中癌症风险增加提供了一个新的视角。

图6 先心病分子分型

数据库信息分析

先心病患病率高达1%,是最主要的出生缺陷之一。

来源:Zhou WZ, Li W, Shen H, Wang RW, Chen W, Zhang Y, Zeng Q, Wang H, Yuan M, Zeng Z, Cui J, Li CY, Ye FY, Zhou Z. CHDbase: A comprehensive knowledgebase for congenital heart disease-related genes and clinical manifestations. Genomics Proteomics Bioinformatics. 2022 Aug 9.

图5 先心病基因功能富集分析

图4 先心病基因表达谱

对于1114篇入选论文,通过人工审阅提取基因/变异与先心病的相关性证据,共整合159项“遗传关联分析(Genetic association)”证据、452项“单核苷酸变异/小片段插入缺失(SNV/Indel)”证据、63项“差异表达(Expression)”证据、240项“拷贝数变异(CNV)”证据、15项“连锁分析(Linkage)”证据和424项“其他类(Other)”证据,包含转基因动物模型和细胞功能学实验证据等。

为了获取先心病核心基因集,进一步采用K-核分解算法(K-Core decomposition)从上述网络中提取了一个包含163个基因的核心基因集合(图3)。

0000
评论列表
共(0)条