《大学课件基因组时代的动物遗传评估技术P35.ppt》由会员分享,可在线阅读,更多相关《大学课件基因组时代的动物遗传评估技术P35.ppt(35页珍藏版)》请在第壹文秘上搜索。
1、基因组时代的动物遗传评估技术遗传评估遗传评估 评估和比较动物个体在遗传上的优劣评估和比较动物个体在遗传上的优劣 为选择优秀种用个体提供依据为选择优秀种用个体提供依据 动物育种的中心工作动物育种的中心工作表现型基因型环境表现型基因型环境常规遗传评估技术常规遗传评估技术特点:利用表型进行遗传评估特点:利用表型进行遗传评估常规遗传评估技术常规遗传评估技术 BLUP方法是常规遗传评估技术的核心方法是常规遗传评估技术的核心yZyXAZZXZZXXXeu 12a2y y:表型信息:表型信息A A:系谱信息:系谱信息eZuXy常规遗传评估技术常规遗传评估技术 对很多重要经济性状十分有效对很多重要经济性状十分
2、有效Milk yield in US Holsteins678910111219601970198019902000Birth yearFirst lactation yield(1000 kg)GeneticPhenotypic美国荷斯坦奶牛产奶量表型及遗传进展美国荷斯坦奶牛产奶量表型及遗传进展加拿大猪100kg体重日龄遗传进展常规遗传评估技术常规遗传评估技术 局限性局限性 当性状表型难以获取或遗传力低时,遗传评估当性状表型难以获取或遗传力低时,遗传评估可靠性不高可靠性不高 不能进行早期遗传评估不能进行早期遗传评估标记辅助选择(MAS)特点:利用表型和部分基因的信息进行遗传评估特点:利用表型
3、和部分基因的信息进行遗传评估标记辅助选择(标记辅助选择(MASMAS)eMgZuXyy y:表型信息:表型信息A A:系谱信息:系谱信息MM:标记信息标记信息遗传评估技术遗传评估技术 MA-BLUP MA-BLUP:标记辅助选择(标记辅助选择(MASMAS)应用现状应用现状实际应用不多实际应用不多应用效果不显著应用效果不显著主要原因:主要原因:已被证实具有显著效应的基因或标记有限已被证实具有显著效应的基因或标记有限(发现并证实一个有效的基因需要很长的时间和(发现并证实一个有效的基因需要很长的时间和很高的成本)很高的成本)这些基因或标记仅能解释有限的遗传变异这些基因或标记仅能解释有限的遗传变异(
4、10 QTL 10 QTL 50%50%遗传变异)遗传变异)基因组选择基因组选择 利用覆盖全基因组的高密度标记(利用覆盖全基因组的高密度标记(SNPSNP)进)进行个体遗传评估行个体遗传评估 可以捕获所有的遗传变异可以捕获所有的遗传变异 无需表型信息即可进行遗传评估无需表型信息即可进行遗传评估 利用利用SNPSNP芯片技术进行标记测定芯片技术进行标记测定 全基因组全基因组SNPSNP芯片芯片YearNo.SNPChipsHuman20083,000,0001000kPoultry20052,800,00060KBovine20072,000,00054kPig20082,000,00060kS
5、heep2007-50k用于遗传评估的数据用于遗传评估的数据100011122002001211101111211110111100112110002012200222011112021012002111221100211120011110010110110102200110022011011200201101020222121122102010011100011220221222112021120120201002022020000211000112020112211121110220111100002122020002210120200022112201110121001112111021
6、121100201021000220002201000201100002202211022112101121110122220012112122200200020020202012221100222222200221211112100211112001101110112002022200011120110102111212111020221002112012110011111021112110211122000101101110202200221110102011121111011202102102121101102212200121101121101202201100222002100211
7、00011100211021101110002220020221212110002220102002222121221121112002011020200122222211221202121121011001211011020022000200100200011110110012110212121112010101212022101010111110211021122111111212111210110120011111021111011111220121012121101022202021211222120222002121210121210201100111222121101基因组选择基因
8、组选择 基本步骤1.利用一个参考群体估计每个SNP的效应参考群体:每个个体都有性状表型记录和所有SNP基因型2.利用SNP效应估计值计算候选群体的个体基因组育种值候选群体:每个个体都有所有SNP基因型基因组选择基因组选择估计所有估计所有SNP的遗传的遗传效应效应SNP基因型基因型性状表型性状表型SNP基因型基因型估计基因组估计基因组育种值育种值SNP基因型基因型候选群体候选群体估计基因组估计基因组育种值育种值参考群体参考群体在参考群中估计标记效应在参考群中估计标记效应g gi i 1niiyX ge设计矩阵设计矩阵 染色体片断遗传效应染色体片断遗传效应估计标记效应估计标记效应在候选群体中计算个
9、体在候选群体中计算个体gEBVgEBVpiiigXEBV1g全部基因组染色体片断全部基因组染色体片断设计矩阵设计矩阵 染色体片断效应染色体片断效应4计算基因组育种值计算基因组育种值(gEBV)(gEBV)基因组育种值基因组育种值1+1-1-1+1+25-1+1-1-1-1+42+1-1-1-1-1-22-1+1-1-1=+38-40SNPeffect-00+20+40-20Chr 1Chr 2Chr 3.Chr nKnown SNPsniiigEBV1 gXNumber of SNPsSNP allele effect标记效应的估计方法最小二乘法最小二乘法岭回归和岭回归和BLUPBLUP贝叶斯
10、方法贝叶斯方法BayesA,B,C BayesA,B,C 和压缩和压缩其他方法其他方法半参数、非参数半参数、非参数机器学习、主成份分析机器学习、主成份分析最小二乘法对标记效应分布无任何假设对标记效应分布无任何假设1:1:对每个标记作单点回归分析对每个标记作单点回归分析2:2:选择效应值最大的选择效应值最大的mm个点放入模型中,同时对其个点放入模型中,同时对其进行估计进行估计1nyXge1niiyX ge不足:不足:1.1.难以确定模型选择的阈值难以确定模型选择的阈值 2.2.容易高估标记效应容易高估标记效应最佳线性无偏预测和岭回归假定全部标记有相同假定全部标记有相同的方差的方差2)(gVarI
11、g 1()X XX ygI1niiyX ge22geBLUP:岭回归岭回归:人为选定人为选定2222000000000.00.ggggsym.贝叶斯方法-A允许不同标记有不同的方差且服从一定分布允许不同标记有不同的方差且服从一定分布)()|()|(222iiiggiigPgPPg(,|)(|,)(,)iiiPyP y gP gg数据模型数据模型方差模型方差模型),(22svgi使用使用Gibbs sampling!Gibbs sampling!u,gi,V Ve,Vgi图片来自图片来自Hayes,2001允许标记方差为允许标记方差为0 0概率为概率为 q概率为概率为 1-q02gi),(22s
12、vgi2012201210122012/gjniijnipjkkikiijgjniijxbxbyxxN,Bayesian shrinkage标记效应越大标记效应越大,压缩越弱压缩越弱 标记效应越小,压缩越强标记效应越小,压缩越强贝叶斯方法-B,压缩准确性:估计育种值和真实育种值间的相关0.8480.7980.7320.31800.10.20.30.40.50.60.70.80.91L LS SB BL LU UP PB Ba ay ye es sA AB Ba ay ye es sB BA Ac cc cu ur ra ac cy y r r 2 2数据来自 Meuwissen al et.,
13、2001不同方法的准确性SNP Add.PolygenicSNP Dom.y1XaZuey1XaYdZuey1Xaea:additive SNP d:dominance SNPu:polygenic e:residuey y:表型信息:表型信息X:X:遗传标记信息遗传标记信息A A:系谱信息:系谱信息模型的扩展基因组选择和常规遗传估计技术基因组选择和常规遗传估计技术的育种效益比较(以奶业为例)的育种效益比较(以奶业为例)后裔测验后裔测验(数据来自加拿大数据来自加拿大)每年参加后测的公牛数量每年参加后测的公牛数量:500500头头 每头后测公牛的育种成本每头后测公牛的育种成本:5 5万美元万美元
14、 后测的总成本后测的总成本:25002500万美元万美元 中选公牛数目中选公牛数目:2020头头 每头中选公牛的育种成本每头中选公牛的育种成本:125125万美元万美元 年遗传进展年遗传进展:0.2150.215遗传标准差遗传标准差 单位遗传标准差遗传进展的育种成本单位遗传标准差遗传进展的育种成本:1.161.16亿美元亿美元 基因组选择基因组选择 每个个体基因组标记信息测定成本:每个个体基因组标记信息测定成本:500500美元美元 基因组单倍型效应估计基因组单倍型效应估计 孙女试验设计孙女试验设计:50:50个公牛家系个公牛家系,每头公牛每头公牛5050个儿子个儿子,每个儿子每个儿子1001
15、00个女儿个女儿 效应估计成本:效应估计成本:125125万美元万美元 公牛母亲选择公牛母亲选择 进行进行 2000 2000头母牛的预选择头母牛的预选择 全部个体进行基因组标记信息测定,根据全部个体进行基因组标记信息测定,根据GEBVGEBV选择选择10001000母牛母牛 评估成本评估成本:100100万美元万美元基因组选择和常规遗传估计技术基因组选择和常规遗传估计技术的育种效益比较(以奶业为例)的育种效益比较(以奶业为例)基因组选择(续)基因组选择(续)公牛选择公牛选择 从从10001000头公牛母亲中获得头公牛母亲中获得500500头预选公牛头预选公牛 对所有公牛进行基因组标记测定,根
16、据对所有公牛进行基因组标记测定,根据GEBVGEBV选择选择2020头公牛头公牛 评估成本评估成本:25万美元万美元 2020头公牛的购买成本头公牛的购买成本:1010万美元万美元 每头公牛连续每头公牛连续3 3年的维持费用年的维持费用:3 3万美元万美元 每年的总育种成本每年的总育种成本:195195万美元万美元 每年的遗传进展每年的遗传进展:0.4670.467遗传标准差遗传标准差 单位遗传标准差遗传进展的育种成本单位遗传标准差遗传进展的育种成本:417417万美元万美元基因组选择和常规遗传估计技术基因组选择和常规遗传估计技术的育种效益比较(以奶业为例)的育种效益比较(以奶业为例)基因组选择的另一策略基因组选择的另一策略 利用参考群体估计SNP效应 选择效应显著的SNP 利用选择SNP的信息构建的参考群体和候选群体个体间的加性遗传相关矩阵(具有性状特异性)用BLUP方法估计候选群体(无表型信息)的个体育种值yZyXGZZXZZXXXu 原理:原理:参考群体参考群体及候选群及候选群体的个体体的个体育种值育种值利用利用SNP的信息构建的加的信息构建的加性遗传相关矩阵性遗传相关矩阵基因型