KEGG数据库简介.pptx
《KEGG数据库简介.pptx》由会员分享,可在线阅读,更多相关《KEGG数据库简介.pptx(28页珍藏版)》请在第壹文秘上搜索。
1、 简介 产生的背景 如何借助计算机全面地展示细胞和生物所包含的生物学信息是后基因组时代的重大挑战之一。科学家期望能够根据基因组中的信息,用计算机计算或者预测出比较复杂的细胞中的通路或者生物的复杂行为。出于这个目的,日本京都大学生物信息学中心的Kanehisa实验室于1995年建立了生物信息学数据库KEGG。特点 KEGG是一个整合了基因组、化学和系统功能信息的数据库。把从已经完整测序的基因组中得到的基因目录与更高级别的细胞、物种和生态系统水平的系统功能关联起来是KEGG数据库的特色之一。 人工创建了一个知识库,这个知识库是基于使用一种可计算的形式捕捉和组织实验得到的知识而形成的系统功能知识库。
2、它是一个生物系统的计算机模拟。 与其他数据库相比,KEGG 的一个显著特点就是具有强大的图形功能,它利用图形而不是繁缛的文字来介绍众多的代谢途径以及各途径之间的关系,这样可以使研究者能够对其所要研究的代谢途径有一个直观全面的了解。用途 各个数据库中包含了大量的有用信息。基因组信息存储在GENES数据库里,包括完整和部分测序的基因组序列;更高级的功能信息存储在PATHWAY数据库里,包括图解的细胞生化过程如代谢、膜转运、信号传递、细胞周期,还包括同系保守的子通路等信息;KEGG的另一个数据库LIGAND,包含关于化学物质、酶分子、酶反应等信息。 通过与世界上其它一些大型生物信息学数据库的连接,K
3、EGG可以为研究者提供更为丰富的生物学信息(LinkDB)。 KEGG提供了Java的图形工具来访问基因组图谱,比较基因组图谱和操作表达图谱,以及其它序列比较、图形比较和通路计算的工具,可以免费获取。影响及发展 KEGG建立了KEGG直系同源系统(the KEGG Orthology (KO) system),这个系统通过把分子网络的相关信息连接到基因组中,从而发展和促进了跨物种注释流程。 结果表明,KEGG被当做一个参考知识库,被广泛的用于基因组测序和其他高通量实验技术得到的大规模数据集的整合和解释中。除了保持对基础研究的支持,随着KEGG分子网络的一些小变化,KEGG正在朝着更加偏向于实际
4、应用的方向发展,这些应用主要集中在整合人类疾病、药物和其他与健康相关的物质。KEGG数据库 KEGG是一个综合数据库,它们大致分为系统信息、基因组信息和化学信息三大类。进一步可细分为16个主要的数据库。可以通过不同的颜色编码来区分。分类分类数据库数据库目录目录颜色颜色系统信息KEGG PATHWAYKEGG通路图KEGG BRITEBRITE功能层次KEGG MODULEKEGG功能单元的模块KEGG DISEASE人类疾病KEGG DRUG药物KEGG ENVIRON天然药物和与健康相关的物质基因组信息KEGG ORTHOLOGYKEGG直系同源(KO)组KEGG GENOMEKEGG中带有
5、完整基因组的物种KEGG GENES在完整基因组中的基因目录KEGG SSDB与基因有关的序列相似性数据库化学信息KEGG COMPOUND代谢物及其他小分子化合物KEGG GLYCAN多糖KEGG REACTION生化反应KEGG RPAIR化学反应中的反应物对KEGG RCLASSRPAIR定义的反应级别KEGG ENZYME酶命名法三类数据库的关系KEGG对象标识符DatabaseObjectPrefixExampleKEGG PATHWAYPathway mapmap, ko, ec, rn, (org)hsa04930KEGG BRITEFunctional hierarchybr,
6、 jp, ko, (org)ko01003KEGG MODULEKEGG moduleM, (org)_MM00010KEGG DISEASEHuman diseaseHH00004KEGG DRUGDrugDD01441KEGG ENVIRONCrude drug, etc.EE00048KEGG ORTHOLOGYKO groupKK04527KEGG GENOMEKEGG organismTT01001 (hsa)KEGG GENESGene / proteinhsa:3643KEGG COMPOUNDSmall moleculeCC00031KEGG GLYCANGlycanGG001
7、09KEGG REACTIONReactionRR00259KEGG RPAIRReactant pairRPRP04458KEGG RCLASSReaction classRCRC00046KEGG ENZYMEEnzymeec:2.7.10.1数据库中包含各种各样的数据对象,这些数据对象是为了用来对生物系统进行计算机模拟的。因此,各个数据库中的数据记录都被称为KEGG对象。这些对象可以通过KEGG对象标识符来识别,标识符由一个与数据库相关的前缀加五个数字构成。(org) represents three-, four-, or five-letter organism code当前数据库中
8、的记录KEGG Database as of 2013/6/5KEGG PATHWAYPathway maps, reference (total)0 (246,368)KEGG BRITEFunctional hierarchies, reference (total)140 (78,848)KEGG MODULEKEGG modules, reference (total)566 (185,274)KEGG DISEASEHuman diseases1,301KEGG DRUGDrugs9,910KEGG ENVIRONCrude drugs and health-related subs
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- KEGG 数据库 简介