群体进化
产品介绍
案例解析
结果展示
送样建议
常见问题

1、技术简介

群体进化是对同一物种的不同亚群,或不同地理分布的品种进行全基因组重测序,通过与参考基因组进行比对,获得大量高精度的SNP、InDel和SV等变异信息,然后进行群体的遗传结构、连锁不平衡和选择性消除等群体遗传学分析,从而在分子层面揭示物种的进化机制、环境适应性等系列问题。

2、技术路线

群体进化

3、分析内容        

分析内容

1)去除接头污染和低质量数据;

2)比对到参考基因组;

3)产出数据统计;

4)SNP检测、注释及统计;

5)InDel检测、注释及统计;

6)SV检测、注释及统计;

7)遗传多样性分析;

8)主成分分析(PCA);

9)群体结构分析;

10)系统进化树构建;

11)连锁不平衡分析;

12)群体历史分析;

13)选择性消除分析;

14)基因功能注释;

4、方案设计

建库类型

350 bp插入片段文库

测序类型

Novaseq,PE150测序

测序数据量建议

重测序建议测序深度为>10X/个体

5、项目周期

样本数量

正常周期(天)

极致周期(天)

X≤10

60


10<X<20

66




 案例解析 

文章题目:Convergent genomicsignatures of domestication in sheep and goats

绵羊和山羊基因组中的驯化特征

绵羊和山羊基因组中的驯化特征


研究物种:绵羊和山羊

材料选取13只亚洲摩弗伦羊、18只野山羊、40只绵羊和44只山羊

测序策略:利用Hiseq 2000平台测序,每个样测序深度12-14×

研究结果:

1. 群体结构多样性分析

在绵羊和山羊的基因组中分别获得了33M和23M的SNP。野山羊的核苷酸多样性较低,反映了较高的近交系数。亚洲摩弗伦羊的核苷酸多样性高于家养山羊,在家养绵羊中发现了277个遗传负荷基因,这些基因与脂肪形成、解剖结构、矮小和颈部半脱位关。

2. 群体选择性清除分析

   利用单体型分化进行选择研究,最终发现绵羊的46个候选的区域,山羊的44个候选区域。这些区域的大部分单体型是比较一致的,两个选择区域中共有的基因大部分与肉、奶、毛发特征和生育力相关。

驯化过程中受到选择的特定和共有的染色体区域

图1驯化过程中受到选择的特定和共有的染色体区域

表2 在绵羊和山羊中,野生和驯化种同源遗传区域差异

在绵羊和山羊中,野生和驯化种同源遗传区域差异

对于KITLG基因,研究发现了绵羊和山羊之间不同选择模式的证据。这种对比信号可能反映了复杂的时空选择和应用于这些不同特性的多种育种策略。例如,对于多效性KITLG基因,绵羊和山羊中的发散信号可以通过放松对山羊毛色的选择来解释。

KITLG基因位于受选择的染色体区域

图3KITLG基因位于受选择的染色体区域


 结果展示

1主成分分析(PCA

主成分分析(PCA)是一种纯数学的运算方法,可以将多个相关变量经过线形转换选出较少个数的重要变量。基于SNP,通过PLINK软件进行主成分分析(Principal components analysis,PCA)分析,得到XXX个样品的主成分聚类情况。通过PCA分析,能够得知哪些样品相对比较接近,哪些样品相对比较疏远,可以辅助进化分析。

样品PCA聚类图

21 样品PCA聚类图

注:图中通过PCA分析将样品聚为三维,pca1代表第一主成分,pca2代表第二主成分;pca3代表第三主成分。一个点代表一个样品,一种颜色代表一个分组。一般遗传关系较近的个体会聚集在一起。

18 样品分群对应关系表

Sample   ID

PC1

PC2

PC3

Sample 1




Sample 2




Sample 3




……




注:

Sample ID:样品编号;

PC1:第一主成分;

PC2:第二主成分;

PC3:第三主成分。

2群体结构分析

群体遗传结构指遗传变异在物种或群体中的一种非随机分布。按照地理分布或其他标准可将一个群体分为若干亚群,同一亚群里的个体亲缘关系较近,亚群与亚群之间亲缘关系稍远。群体遗传结构分析能够提供个体的血统来源及其组成信息,是一种重要的遗传关系分析工具。首先,对SNP中紧密连锁的位点进行筛选,最终获得XX个SNP。基于SNP,通过ADMIXTURE(Alexander et al., 2009)软件,分析XX个样品的群体结构,分别假设XX个样品的分群数(K值)为1-20,进行聚类。根据CV error(Cross validation error)最低点对应的K值来确定最佳分群数为3。反映了我们所有的样品可能来自于3个原始的祖先。

样品分群数为 1-20 的群体结构图

样品分群数为 1-20 的群体结构图

22 样品分群数为 1-20 的群体结构图

注:上图中每种颜色代表一个群,每行代表所有个体对应一个分群值时的情况,例如K=2是表示所有样品在分成两种遗传成分时的群体结构;下图中展示了193个样品分群值从1-20的聚类情况。下图中为每个K值对应的CV error值, K3的时候CV error最小,即为最佳K值。

如图所示,本项目的XX个样品可以分为XX个群,样品与群体关系如下表:

19 样品分群对应关系表

Sample ID

Q1

Q2

Q3

......

Sample 1





Sample 2





Sample 3





……





注:

Sample ID:客户样品编号;

Q1:样本来自第一个原始祖先的可能性;

Q2:样本来自第二个原始祖先的可能性;

Q3:样本来自第三个原始祖先的可能性。

3系统进化树构建

系统进化树是描述群体间进化顺序的分支图或树,用来表示物种之间的进化关系,根据各类生物间的亲缘关系的远近,把各类生物安置在有分枝的树状的图表上,简明地表示生物的进化历程和亲缘关系。基于SNP,通过RAxML软件(Stamatakis,2006)的 maximum likelihood算法构建XXX个样品系统进化树。

系统进化树

23 系统进化树

注:图中每个分枝为一个样品,两个临近的分支的连接处成为节点,表示推断祖先的现存类群在树最基部的分支点称为根节,一个单一的共同祖先被定义为进化支或单源群。

 样本要求

样品

具体要求

样品类型

无降解且无RNA污染的DNA样品

样品选择

同一物种自然群体的不同亚种(或品系),每个亚群样本数≥10; 群体数≥3;总体不少于30个样本

样品需求量

建议送样量:小片段文库≥2 µg;

最低送样量:小片段文库≥1 µg

构建多次(N次)文库所需DNA量:2×(N+1)µg

样品浓度

建议浓度:≥20 ng/µl

最低浓度:≥10 ng/µl

样品纯度

OD260/280=1.8~2.0


 常见问题

1、群体大小选择多少合适?

     需要三个亚群/亚种以上,每个亚群选取10个样本左右(推荐动物≥10个,植物≥15个,珍稀物种可适当减少个体),总体建议不少于30个样本。

2、群体进化研究的群体选择标准?

某物种的各个亚群,如野生种与驯化种、地理亚群等,每个亚群间划分明显,同一亚群内的个体有一定代表性。如研究驯化机制,则需要选取野生型、驯化型样本;如研究适应性进化,则需要选取不同地理环境,不同海拔高度的样本;如研究种群历史,需要在物种的可能起源地以及各个分布区域进行选材


客户留言

客户留言

Customer Message

联系我们
Contact Us
联系邮箱:nanqing@magiltd.com 公司电话:0551-82311173 公司地址:
北京:北京市朝阳区惠河南街高碑店村一区33号楼
合肥:安徽省合肥市巢湖经济开发区未名生物医药园区C栋3楼
website qrcode

微分科服

website qrcode

微分健康