人全基因组重测序
产品介绍
案例解析
结果展示
送样建议
常见问题

1、技术简介               

人类全基因组测序(Whole Genome Sequencing, WGS)基于人基因组参考序列,对个体或者群体进行全基因组范围的信息解读。通过这种方法,寻找出大量单核苷酸变异(Single Nucleotide Variants, SNV)、插入缺失变异(InsertionDeletion, InDel)、结构变异(Structure Variation, SV)以及拷贝数变异(Copy Number Variation, CNV),发现疾病的致病基因和突变,解析疾病发病机制,阐明遗传机制并获得群体遗传特征。

2、技术路线

人类全基因组测序

3、分析内容

标准分析内容

1、SNP检测,注释和统计

2、InDel检测,注释和统计

3、SV检测,注释和统计

4、CNV检测及注释

5、变异全局统览

6、突变位点过滤

高级分析内容

肿瘤分析

1、LOH检测和注释

2、融合基因分析

3、易感基因筛查

4、驱动基因分析

5、肿瘤突变负荷统计

6、肿瘤突变特征及突变频谱

6.1、肿瘤突变频谱

6.2、肿瘤突变特征谱

7、高频突变基因分析

7.1、高频突变基因统计

7.2、高频突变基因通路富集分析

8、高频拷贝数变异分析

9、高频突变基因靶向用药预测

单基因遗传病分析

1、基于样本信息的突变位点筛选

1.1、显性遗传突变分析

1.2、隐性遗传突变分析

1.3、新发突变分析

1.4、纯合子区域(ROH)分析

复杂疾病分析

1、疾病显著性关联位点分析

1.1、Fisher精确检验

1.2、绘制曼哈顿图

1.3、绘制Q-Q图

1.4、绘制Locus Zoom图

4、方案设计                   

建库类型

350 bp插入片段文库

测序类型

PE150测序

测序数据量建议

肿瘤研究——肿瘤50-100×,

癌旁/外周血30×;

单基因遗传病——30×;

复杂疾病——10-30×

5、项目周期                     

样本数量

正常周期(天)

极致周期(天)

X≤50

30

20

X>50

30(需根据实际样本数评估)

20(需根据实际样本数评估)


案例解析

胰腺神经内分泌肿瘤全基因组图谱

背景介绍

胰腺神经内分泌肿瘤Pancreatic neuroendocrine tumours, PanNET是全世界范围内排名第二的常见神经上皮肿瘤致死率高达60%。世界卫生组织(WHO)根据该类肿瘤的增值率将PanNET划分为三组:低等级G1,中等级G2和高等级G390%的患者为G1G2 等级。就目前对G1G2PanNET的致病分子机理认识,还不足以通过预测个体肿瘤的恶化程度判断患者是否会从早期高强度的治疗中获益,并降低疾病早期患者因为过度治疗带去的伤害。近期通过表达谱以及外显子组研究表明在14%PanNET患者中mTOR信号通路活跃,并表明是一个有效的靶向治疗目标通路。虽然mTOR抑制剂依维莫司已被FDA批准用于治疗PanNET,但仍然无法通过分子水平的分析确认哪些患者群体会从该药物的治疗中获益。

材料

Ø   WGS98PanNET患者的肿瘤样本(肿瘤平均含量为82%)以及癌旁组织,其中G1等级样本36例,G2等级样本57例,G3等级样本5;

Ø   验证:4PanNET患者肿瘤样本以及1例结肠息肉样本用于验证肿瘤突变特征谱。

测序平台

IlluminaHiSeq 2000平台,PE100

测序方法

肿瘤:61×;癌旁:38×

结果

1.PanNET突变机制研究

98PanNET样本中鉴定出5种突变特征谱(A-E)(图1-a)。特征谱A之前没有报道过,本研究中命名为MUTYH,因为所有由这类特征谱主导的肿瘤都存在MUTYH胚系失活突变,并伴随杂合性缺失;特征谱B-E之前均有报道,依据先前报道的名称命名。由MUTYHAPOBECBRAC或者Age特征谱主导的肿瘤样本每Mb碱基存在较多的突变。

在另外4PanNET样本和一例结肠肿瘤样本中验证MUTYH特征谱(图1-b)。三例PanNET样本和一例结肠肿瘤样本包含主导性的MUTYH特征谱,存在胚系损伤MUTYH突变并伴随杂合性缺失,一例含有良性MUTYH突变的PanNET样本中不存在该类型的突变特征谱(图1-d)。

受到BRAC缺失特征谱主导的肿瘤样本包含一个致病的BRCA2胚系突变,并出现近期在BRCA缺失的乳腺癌、胰腺癌、卵巢癌以及食管癌样本中报道的广泛分布的基因组不稳定现象(图1-c)。

胰腺神经内分泌肿瘤的突变特征谱

1 胰腺神经内分泌肿瘤的突变特征谱

2.探究PanNET样本体细胞驱动基因

98PanNET样本共鉴定出3097个体细胞编码区突变,涉及2567个基因。使用IntOGen分析得到了16个显著高频突变基因(图2-a)。与之前的报道结果一致,MEN1的突变在所有样本中最高频出现(37%的肿瘤样本)(图2-b)。

胰腺神经内分泌肿瘤的高频突变基因

2胰腺神经内分泌肿瘤的高频突变基因

3.探究PanNET样本体细胞拷贝数变异

依据每条染色体上的拷贝数变化情况,可将所有样本划分成4个独立的组别(3-a),根据下列标准分类:1.均为染色体上的拷贝数降低事件,常常丢失某些特定的染色体(123681011151622),并且多在G2类样本中出现;2.有限的拷贝数变化事件,多数缺失染色体113.多倍体,所有的染色体均出现拷贝数的增加,这类样本拥有最高的体细胞突变率,1.98 mutations/Mb(图3-c);4.非整倍体(3-ab),均为染色体上的拷贝数增加事件,涉及多条染色体。随后通过对整个研究队列中的所有样本进行分析,找出了高频出现的拷贝数变化事件,MEN1CDKN2AEYA1FMBT1等基因拷贝数降低,PSPNULK1等基因拷贝数增加。

胰腺神经内分泌肿瘤的拷贝数变异分析

3胰腺神经内分泌肿瘤的拷贝数变异分析

4.整合探究PanNET样本中异常的通路

结合30例样本的RNA-seq数据,共分析得到4条通路在PanNET样本中显著改变。这些通路的干扰很可能与临床的表型相关,可以在选择差异性治疗方案时提供参考。

胰腺神经内分泌肿瘤高频突变基因富集通路

1. DNA损伤修复通路:胚系有害突变——碱基切除修复基因MUTYH以及同源重组基因CHEK2BRCA2

2.染色质重构基因MEN1 SETD2ARID1AMLL3高频失活,导致大范围的转录失调;

3.端粒维持基因:TERT基因表达量上调,MEN1结合TERT启动子区,影响端粒完整性调控机制,而端粒延长为实体瘤生存制造了良好条件。

4胰腺神经内分泌肿瘤高频突变基因富集通路

结果展示

标准分析部分内容展示

1.SNVInDel检测、注释与统计

SNV、InDel在基因组上的位置分布(左)和外显子区的功能

图5 SNV、InDel在基因组上的位置分布(左)和外显子区的功能(右)

单核苷酸变异(SNV)是研究人类家族遗传变异的重要依据,人基因组上平均每1000个核苷酸即可出现1个单核苷酸多态性的变化,是人类基因组上多态性最高的变异类型,其中有些单核苷酸多态性可能与疾病发生相关,但大多数与疾病无关。

基因组上小片段(<50 bp)的插入或者缺失(InDel),可以造成蛋白质编码区的移码突变,较大程度改变蛋白质的功能。对SNV以及InDel事件在基因组上的位置信息以及通过各类数据库进行注释,可以有效过滤无生物学意义或与表型无关的突变,缩小后续分析范围。


2.CNV检测、注释与统计

拷贝数变异(CNV)是由基因组发生重排而导致的,一般指长度1kb以上的基因组大片段的拷贝数增加或者减少,主要表现为亚显微水平的缺失和重复,会影响基因组的稳定性以及基因功能。目前的研究表明,CNV事件大多数与疾病有直接的因果关系,如老年痴呆、红斑狼疮、高血压、地中海贫血症等常见疾病均与基因组上的拷贝数异常相关。

人类染色体上的拷贝数变化汇总统计

图6 人类染色体上的拷贝数变化汇总统计

3.SV检测、注释与统计

染色体结构变异(SV)是指染色体序列大片段(≥50 bp)的缺失、重复、倒位、易位。与SNV相比,结构变异虽然发生的频率较低,但累计的序列长度却大大超过了SNV,因此对人类健康和疾病的影响更为显著。在比对到参考基因组序列的基础上,通过染色体结构变异分析软件检测样品全基因组所有潜在的SV位点。

                                                                                                                                    表1 SV类型统计

检测到的SV总数

DEL:缺失(deletion);

INS:插入(insertion);

INV:倒位(inversion);

ITX:染色体内部易位(intra-chromosomaltranslocation);

CTX:染色体间易位(inter-chromosomaltranslocation);

Total:检测到的SV总数。

4.变异汇总

变异全局总览

             7   变异全局总览

将全基因组检测出的SNVInDelSVCNV以及深度等信息以圆形图展示,便于对整体情况的掌握及对不同样本的直观对比。如图3所示样本的结果,从最外层到最内层依次是:物种染色体信息、测序深度及覆盖度信息、基因在染色体上的密度分布、SNV密度分布(颜色越深代表SNV越多)、InDel信息(颜色越深表示InDel的长度越长)、CNV信息(橙色表示大片段重复,蓝色表示大片段缺失)、SV信息(绿色表示染色体缺失,红色表示染色体插入,黄色连线表示染色体间易位,蓝色连线表示染色体内部易位,绿色连线表示倒位)。

                                     

高级分析部分内容展示

1.肿瘤突变特征及突变频谱

DNA 复制过程中的错配、内源或外源性诱变剂的诱导及 DNA 修复机制的缺陷等多种突变过程催生了肿瘤的体细胞突变,不同的突变过程产生特定的突变类型组合,即为突变特征。对体细胞 SNV进行多角度分析,包括突变频谱(Mutation spectrum)和突变特征(Mutation signature)。从这些结果中可清晰了解癌症突变在点突变水平上的特征。通过突变频谱分析可以得知各个肿瘤样本各种类型突变的数量及样本是否有某种类型突变���偏好性。通过分析体细胞突变特征,可以研究不同癌种的体细胞点突变特点。

肿瘤样本SNV突变特征以及突变频谱分析

8肿瘤样本SNV突变特征以及突变频谱分析

2. 高频突变基因分析

高频突变基因(Significantlymutated genes, SMG)综合考虑了体细胞SNV InDel

等变异事件,指突变频率显著高于背景突变频率(Backgroundmutation rate, BMR)的基

因。通过Pathway 显著性富集能确定高频突变基因参与的最主要生化代谢途径和信号转导途径,并与研究样本表型进行比较,找到与表型产生相关性最高的通路以及通路中的关键基因。

肿瘤样本中的高频突变基因、富集通路以及样本对应表型汇总

9肿瘤样本中的高频突变基因、富集通路以及样本对应表型汇总

参考文献

[1] Zou S, LiJ, Zhou H, et al. Mutational landscape of intrahepatic cholangiocarcinoma.[J].Nature Communications, 2014, 5:5696.

[2]Scarpa A, Chang D K, Nones K, et al. Whole-genome landscape of pancreaticneuroendocrine tumours[J]. Nature, 2017, 543(7643):65.                                        


样本要求                 

样本总量与质量要求

送样建议

gDNA

普通样本提取gDNA

m≥3 μg

c≥30 ng/μL

无降解或者轻微降解

-80℃保存,干冰运输

FFPE提取gDNA

m≥1 μg

c≥30 ng/μL

DNA片段≥250 bp

新鲜培养细胞

≥5×106 cell

离心收集细胞,并用PBS洗两次,放置干冰中速冻30 min,随后-80℃保存,干冰运输

新鲜组织

≥50 mg

如果是活检组织,取黄豆大小 2-3 个,穿刺组织长度 1 cm2-3

取出组织立即放置干冰中速冻30 min,随后-80℃保存,干冰运输

全血

≥1 mL

使用含有柠檬酸钠或EDTA为抗凝剂的采血管收集血液,缓慢颠倒10次充分混匀,-80℃保存,干冰运输

FFPE

≥ 10片,未染色,100 mm25 ~ 10μm 厚度

提供多余一片进行HE染色,确定肿瘤细胞的含量(当下机数据大多数来自正常细胞时进行样本核查,建议客户送样前自行进行HE染色确定肿瘤含量,建议肿瘤含量>60%

常温保存、运输

l   将gDNA、细胞或者组织样本放置1.5 mL的离心管中,和样本信息单一一对应标记上样本名称。使用封口膜封住离心管,并放置在50 mL离心管(或其他容器)中,便于在干冰中寻找样本。

l   将样本放入合适的运输环境中,并尽快寄出,防止样本发生降解。避免假期前一日寄送样本,以免无人收样,导致样本降解。

客户留言

客户留言

Customer Message

联系我们
Contact Us
联系邮箱:nanqing@magiltd.com 公司电话:0551-82311173 公司地址:
北京:北京市朝阳区惠河南街高碑店村一区33号楼
合肥:安徽省合肥市巢湖经济开发区未名生物医药园区C栋3楼
website qrcode

微分科服

website qrcode

微分健康