原核转录组测序
产品介绍
案例解析
结果展示
送样建议
常见问题

1、技术简介

原核转录组测序是基HiSeq,构建链特异性文,研究原核生物在某个时期或者在某种环境条件下转录出来的所mRNA。由于原核生mRNApolyA尾结构,需要采用去除rRNA的方法构建文库。

2、技术路线

原核转录组测序

3、分析内容       

分析内容

1)去除接头污染和低质量数据;

2)比对到参考基因组;

3)产出数据统计;

4SNP检测、注释及统计;

5InDel检测、注释及统计;

6SV检测、注释及统计

4、方案设计

分析内容

分析条款

备注

数据质控

1、对原始数据进行去除接头、污染序列及低质量reads的处理


2、测序评估(比对统计、测序随机性评估、Reads在基因组上的分布)

标准分析

1、统计rRNA去除效率(rRNA比例统计)


2、预测新转录本及功能注释


3SNPInDel分析


4、基因结构分析(操纵子、TSSTTS和启动子预测)


5UTR 注释及相关分析


6、反义转录本预测


7sRNA分析


8、基因表达水平分析(对每个基因的表达量进行估计)


9、基因差异表达分析(两个或者两个以上的样品)


10、差异基因的 GO 富集分析


11、差异基因的 KEGG 富集分析


12、蛋白互作网络分析


5、项目周期

样本数量

正常周期(天)

极致周期(天)

X≤24

55

30

备注:极致周期需向销售总监申请,批准后与项目管理部进行协调,方可执行极致周期


 案例解析 

Kim SK, Jung KH,et al., Changes in Bacillus anthracis CodY regulation under host-specificenvironmental factor deprived conditions. BMC Genomics.2016;17:645.

研究背景

炭疽杆菌,是炭疽热的病原菌。炭疽杆菌感染宿主的时候,宿主环境的改变,会诱导炭疽杆菌呈现不同的基因表达模式。CodY是一个起全局调控作用的转录因子,对炭疽杆菌的代谢、生物合成和毒性有重要的调节作用。作者通过转录组研究的方法,检测野生型和CodY 突变体在不同环境(FeCO2,葡萄糖)饥饿处理下的表达模式。发现有一些基因的表达不依赖于CodY,而一些基因的表达,在特定环境下,受CodY 的诱导/ 抑制。最后作者通过染色质免疫共沉淀,检测了那些可能受CodY 调控的基因,是否被CodY 结合。

材料与方法

材料:炭疽杆菌野生型和CodY 突变体,在全营养培养基,分别缺乏FeCO2、葡萄糖的培养基中培养。方法:转录组文库,HiSeq2000测序平台

1、野生型和CodY 突变体,在不同环境饥饿处理下,基因表达模式都会发生改变。其中有一些基因只受环境调节,另一些受CodY 调节。

2、在铁饥饿环境下,铁稳态基因的表达与CodY 无关,而铁转运蛋白和氨基酸合成基因的表达依赖于CodY的调节。


 结果展示 

差异表达作图

火山图可以直观的体现基因在两个样品()间表达水平的差异和及显著性。C-1_vs_B-1差异表达基因火山图如下:

差异表达基因volcano图


21 差异表达基因volcano

图中每一点代表一个基因,横坐标为基因在样品间表达量差异倍数的对数值,纵坐标为基因表达量变化的统计学显著性的负对数值。横坐标绝对值越大,差异倍数越大;纵坐标值越大,差异表达筛选越可靠。图中红色方形点代表上调差异表达基因,蓝色圆形点表示下调差异表达基因,黑色三角形点表示非差异表达基因。

MA图可以直接体现基因在两个样品()间表达水平和差异倍数的整体分布。C-1_vs_B-1差异表达基因MA图如下:

差异表达基因MA图

22 差异表达基因MA

图中每一点代表一个基因,横坐标为log2(FPKM),为两样品表达均值的对数值;纵坐标是基因在样品间表达量差异倍数的对数值,用于衡量差异大小。图中红色方形点代表上调差异表达基因,蓝色圆形点表示下调差异表达基因,黑色三角形点表示非差异表达基因。

对差异表达基因进行层次聚类分析,将具有相似或相同表达模式的基因进行聚类。差异表达基因聚类热图如下:

差异表达基因聚类热图

23 差异表达基因聚类热图

横坐标代表样品名称及其聚类结果,纵坐标代表的差异基因及其聚类结果。图中不同的列代表不同的样品,不同的行代表不同的基因。颜色代表了基因在样品中的表达量水平。

差异表达基因数目统计

差异表达基因数目统计见下表:

13 差异基因数目统计表

DEG

total

up

down

C-1_vs_B-1

145

58

87

C-2_vs_B-2

165

98

67

C-3_vs_B-3

173

142

31

DEG: 差异组合;

total: 总的差异基因数目;

up: 上调差异基因数目;

down: 下调差异基因数目。

差异组合(差异组合数目:2~5组)韦恩图如下:

差异组合间venn图

24 差异组合间venn

差异表达基因GO分析

差异表达基因GO功能分类统计图如下:

差异表达基因GO分类统计图

25 差异表达基因GO分类统计图

注:横坐标为GO分类,纵坐标为基因数目.

根据实验目的筛选差异基因后,富集分析研究差异基因在GO中的分布情形以阐述实验中样本差异在基因功能上的体现。使用topGO[16]行富集分析,富集分析结果展示如下:

差异表达基因topGO有向无环图(分子功能)

26 差异表达基因topGO有向无环图(分子功能)

对每个GO节点进行富集,最显著的10个节点在图中用方框表示,图中还包含其各层对应关系。每个方框(或椭圆)内给出了该GO节点的内容描述和富集显著性值。不同颜色代表不同的富集显著性,颜色越深,显著性越高。对应于图25的富集结果(xls格式)如下:

                                                          14 topGO富集结果(分子功能,部分)

GO.ID

Term

Annotated

Significant

Expected

KS

GO:0035145

exon-exon junction complex

15

0

0.11

0.0038

GO:0043197

dendritic spine

76

1

0.56

0.0045

GO:0045180

basal cortex

9

0

0.07

0.0047

GO:0005802

trans-Golgi network

159

1

1.16

0.0048

GO:1905368

peptidase complex

97

1

0.71

0.007

GO:0016324

apical plasma membrane

302

2

2.21

0.0096

GO:0070847

core mediator complex

5

0

0.04

0.0105

GO:0031265

CD95 death-inducing signaling complex

3

2

0.02

0.013

GO:0098553

lumenal side of endoplasmic reticulum membrane

12

0

0.09

0.0137

GO.ID: GOTerm ID

Term: GO Term名称;

Annotated: 注释到该GO Term的基因数目;

Significant: 注释到该GO Term的差异基因数目;

Expected: 注释到该GO Term的差异基因数目的期望值;

KS: Term富集显著性,值越小,表示富集越显著

差异表达基因KEGG pathway注释统计

在生物体内,不同的基因产物相互协调来行使生物学功能,对差异表达基因的通路(Pathway

注释分析有助于进一步解读基因的功能。KEGGKyoto Encyclopediaof Genes and Genomes)数据库是关于代谢通路的主要公共数据库。

差异表达基因的通路注释结果示意见下图:

差异表达基因的KEGG通路注释图

28 差异表达基因的KEGG通路注释图

图中红色框标注的酶与上调差异基因有关;图中蓝色框标注的酶与上调和下调基因均有关;图中绿色框标注的酶与下调差异基因有关。

C-1_vs_B-1差异表达基因KEGG的注释结果按照KEGG中通路类型进行分类,分类图如下图所示:


差异表达基因KEGG分类图


29 差异表达基因KEGG分类图

注:纵坐标为KEGG代谢通路的名称,横坐标为注释到该通路下的基因个数。

差异表达基因蛋白网络互作

STRING[17]是收录多个物种预测的和实验验证的蛋白质-蛋白质互作的数据库,包括直接的物理互作和间接的功能相关。结合差异表达分析结果和数据库收录的互作关系对,构建差异表达基因互作网络。对于数据库中包含的物种,可直接从数据库中提取出目标基因集的互作关系对构建互作网络;对于数据库中未收录信息的物种,使用BLAST软件,将目的基因与数据库中的蛋白质进行序列比对,寻找同源蛋白,根据同源蛋白的互作关系对构建互作网络。构建完成的蛋白质互作网络可导入Cytoscape[18]软件进行可视化。Cytoscape可视化的差异表达基因蛋白质互作网络如下图

差异表达基因蛋白网络互作图

32 差异表达基因蛋白网络互作图

图中红色代表上调差异表达基因,天蓝色代表下调差异表达基因。

 样本要求 

样品

具体要求

样品类型

Total   RNA

样品需求量

建议送样量:>5µg

样品浓度

建议浓度:> 50 ng/µL

样品纯度

OD260/280=1.8--2.0 并确保 RNA 无降解;Aglient 2100 检测仪分析 RNA 完整性数据 RIN≥7


1.物种没有参考基因组,可以做原核转录组分析吗?

不可以。原核转录组要求有参考基因组,因为原核生物的mRNA一般为多顺反子,直接拼接效果较差,无法准确确定基因的起始终止位置。

2.原核生物与真核生物在进行转录组测序文库构建时有什么区别?

在原核生物中,mRNA只占全部RNA的1-5%,其余绝大部分是核糖体RNA(rRNA),原核生物并不像真核生物mRNA具有polyA的结构,所以无法直接利用oligoT将mRNA纯化出来,如果直接使用total RNA进行测序,那么测序效率会非常低,因为大部分的序列都来自rRNA。目前,提高原核生物中mRNA的量,最主要的方式是去除total RNA中rRNA。

3.rRNA 去除方法?

原核mRNA一般不具有polyA结构,这类不具有polyA结构的转录组样品,一般采用rRNA探针法特异性去除rRNA。


客户留言

客户留言

Customer Message

联系我们
Contact Us
联系邮箱:nanqing@magiltd.com 公司电话:0551-82311173 公司地址:
北京:北京市朝阳区惠河南街高碑店村一区33号楼
合肥:安徽省合肥市巢湖经济开发区未名生物医药园区C栋3楼
website qrcode

微分科服

website qrcode

微分健康