恶性肿瘤

首页 » 常识 » 诊断 » 多伦多大学癌症基因组调控元件突变率变异性
TUhjnbcbe - 2021/8/29 1:28:00
白癜风早期如何治疗 http://m.39.net/pf/a_6489068.html

非编码RNA与外泌体研究策略及数据分析现场与网络实战学习班(干货满满)

-04-23

学姐经验视频集:选刊/投稿/回复审稿,科研绘图,答辩ppt

-04-22

太漂亮了!个绝美细胞信号通路图PPT!全部可编辑,每个都有详细说明和参考文献,颜值与实力在线!

-04-17

点击免费领取通路图

背景

基因组通过暴露于外源和内源突变剂积累体细胞突变。这些突变的亚群赋予细胞选择性增殖优势并驱动肿瘤发生,而大多数突变是功能中性的客运突变。驱动突变的发现和验证是癌症基因组学研究的一个主要焦点。然而,客运突变的全基因组景观也有助于我们理解肿瘤发生和肿瘤进化。体细胞突变频率显示多种在分辨率下复杂的基因组变异。在兆碱基规模的基因组窗口中,突变频率的变化与转录活性、染色质状态和DNA复制有关,因为晚期复制和非转录区域通常比早期复制和高表达基因的区域更容易发生突变。在碱基对解析时,某些三核苷酸通过致癌物暴露、DNA修复通路缺陷和DNA复制异常等过程优先发生突变。例如,在转移性肿瘤中检测到的突变特征可提供患者治疗史的信息。这些大规模和核苷酸水平的变异共同促成了肿瘤的异质性,并留下了肿瘤进化及其细胞起源的印迹。

简介

年5月3日,来自加拿大多伦多大学的JüriReimand及其团队在GenomeBiol(IF:10.)杂志上发表名为Functionalandgeneticdeterminantsofmutationratevariabilityinregulatoryelementsofcancergenomes的研究[1]。

主要结果

量化癌症基因组中局部突变的统计框架

我们实施了一个统计模型,即局部突变回归模型(RM2),以量化功能基因组元件(即位点)中突变过程的局部活性,每个突变过程涵盖数十至数百个核苷酸(图1a)。该模型考虑了全基因组的一组元素,如从染色质免疫沉淀和DNA测序(ChIP-seq)中分离出的TFBSs,在整个基因组中检测到成千上万个位点。该模型使用负二项回归来评估感兴趣的基因组元件与这些元件的上游和下游的控制序列相比,是否共同受到不同的突变频率的影响。对全基因组测序实验中的体细胞单核苷酸变异体(SNVs)和小插入-缺失进行分析;然而,该模型可以扩展到稀有种系变异和其他类型的变异,如结构变异断点。

为了确定基因组元件的突变频率是否不同于在给定三核苷酸水平和兆碱基水平协变量情况下的侧翼序列,我们使用似然比检验评估了协变量isSite的重要性。该协变量的显著和正系数表明,相对于侧翼对照,基因组元件的突变频率增加,而负系数表明突变耗竭。同样,我们可以发现潜在的遗传或临床交互作用与突变过程的局部活性。给定肿瘤的二元亚组分类(coFac),我们评估其与局部突变频率交互作用的显著性。交互作用的正系数表明,当占亚组的总体差异时,临床或遗传肿瘤亚组中的突变频率升高。我们还将分析扩展到突变的类别,比如那些COSMIC突变签名,通过只允许在突变计数中包含特定的类别(nMut)中。我们使用模拟数据集、功率分析和参数变化评估方法的性能,如下所示(图1b-d)。

图1.用RM2表征局部突变过程

转录起始位点的突变富集与靶基因的mRNA丰度和不同通路相关

我们询问TSSs和开放染色质位点突变频率的增加是否与靶基因的转录相关。我们使用PCAWG中20种癌症类型的匹配RNA-seq数据来量化调控区的组织特异性活性。根据每种癌症类型中mRNA丰度的中位数,蛋白质编码基因被分配到五个大小相等的区段中,使得第一个区段包括沉默基因,第五个区段包括大量高度转录的基因。在启动子-捕获Hi-C实验中,根据基因在基因体和启动子中的位置,以及染色质的共识长链相互作用,将开放染色质位点分配给基因。这提供了TSSs和开放染色质位点的组织特异性图谱,并以转录物丰度作为位点活性的量度。TSSs中较高的突变频率与靶基因的组织特异性mRNA丰度密切相关(图3a)。在高转录基因的第五个结合区,TSSs在12/20癌症类型和泛癌队列中的突变中持续富集。在黑素瘤、卵巢癌、肺癌、胰腺癌和乳腺癌中发现了转录活性和TSS特异性诱变的相关性最强(图3b,c)。

图3.转录起始位点突变富集与靶基因mRNA丰度和通路多样性相关

CTCF结合位点的突变富集与构成DNA结合和核心序列基序有关

我们检测了CTCF结合位点突变频率的升高是否与功能位点特征相关。我们使用70种细胞系中DNA结合的保守程度作为位点活性的代表。我们将在ENCODE中编目的个独特的CTCF结合位点分组为五个相等的片段,使得第一个片段包含在单个细胞系中观察到的位点,而第五个片段包括组成型结合位点,在67/70细胞系中发现中位位点(图4a)。通过这样做,我们可以在不同的位点活性水平上测试突变频率和基因组关联。构成结合的CTCF结合位点富含染色质环锚和共有核心CTCFDNA结合基序(图4b)。综上所述,这些特征意味着位点的组成型结合代表了功能上重要的CTCF结合位点。

图4.CTCF组成型活性结合位点的局部突变过程

与局部突变相关的复发性驱动突变和拷贝数改变

为了发现局部突变的潜在遗传机制,我们检测了肿瘤基因组中是否存在与基因调控和结构元件更高突变频率相关的特定特征,如复发性突变。为了实现这一分析,我们收集了使用ActiveDriverWGS方法预测的37个频繁SNVs和indels的驱动基因,使用GISTIC2方法在PCAWG项目中检测到的70个复发性拷贝数改变(CNAs)以及两种全基因组非整倍体测量值、全基因组重复(WGD)和基因组改变百分比(PGA)。RM2整合分析发现,在9种癌症类型中基因组特征与位点特异性突变频率升高之间存在的41种显著交互作用,包括5个驱动基因(ARID1A、BRAF、CTNNB1、HIST1H1C、SETD2)、25个重复扩增位点和1个基因组缺失位点(RM2FDR0.05,交互作用P0.05)(图5a)。

图5.与局部突变相关的复发性驱动突变和拷贝数改变(CNA)

结论及展望

我们的研究为未来的发展开辟了新的途径。对全癌症基因组序列和丰富的肿瘤临床和病理特征的综合分析可能会突出临床变量和局部突变的相关性,从而导致基于WGS的新生物标志物。考虑到患者生活方式信息、环境暴露和种系变异,分析中可阐明致癌物和内源性DNA修复缺陷的影响。我们的遗传关联目录提供了关于突变机制的假设,可以使用基因组编辑和突变分析进行实验测试。人类群体中的罕见种系变异、在遗传疾病中检测到的新生变异和健康组织中发现的广泛体细胞基因组变异,为研究作用于功能性非编码元件的突变过程提供了进一步途径。本研究为整个基因组中的局部突变过程提供了详细的注释,并使未来的工作能够破译局部突变和癌症驱动机制、分子异质性和基因组进化之间的相互作用。

原文链接

1
查看完整版本: 多伦多大学癌症基因组调控元件突变率变异性