《临床表型多组学标记物专用元数据数据字典.docx》由会员分享,可在线阅读,更多相关《临床表型多组学标记物专用元数据数据字典.docx(10页珍藏版)》请在第壹文秘上搜索。
1、临床表型多组学标记物专用元数据数据字典A.1基因组序号中文名称英文名称缩写词定义数据类型值域约束/条件最大出现次数备注1基因组生物标记物编号genomicbiomarkeridentifierGBID基因组生物标记物的唯一标识符,SNP优先使用rsid字符串型自由文本M12分类CategoryCat基因组生物标记物的分类,包含SNP、Inde1、CNV、SV字符串型自由文本MN3变体类型VarianttypeVarianttype变异的具体类型,包含转换、颠换、插入、缺失、重且、异位等字符甲型自由文本MN4变异前染色体RawChromosomeRawChr二代基因组生物标记物变异前的起始染色体
2、编号字符串型自由文本MN5变异前起始位置RawStartPositionRawStartPos基因组生物标记物变异前的起始坐标数值型正整数MN6变异前终止位置RawEndPositionRawEndPos基因组生物标记物变异前的终止坐标数值型正整数MN7变异后染色体VariantsChromosomeVarChr基因组生物标记物变异后的染色体编号字符串型自由文本MN8变异后起始位置VariantsStartPositionVarStartPos基因组生物标记物变异后的起始坐标数值型正整数MN9变异后终止位置VariantsEndPositionVarEndPos基因组生物标记物变异后的终止坐标
3、数值型正整数MN10原始碱基RawBaseRawBase基因组生物标记物变异前的碱基名字符串型自由文本MN11等位基因AllelesAlleles位于一对同源杂色体相同位置上控制同一性状不同形态的基因字符串型自由文本C,当变异类型为SNP时必选N12基因名称GeneNameGeneName标记物位置的基因名称(GeneSymbol)字符甲型自由文本0N13基因IDGeneIdentifierGeneID标记物位置的基因ID(EntrezID)数值型正整数0N14功能区域FunctionalRegionFR生物标记物所在区域的功能:内含子、外显子、ORF.CDS、UTR等字符串型自由文本MN15
4、变体长度VariantlengthVariantlength发生变异的碱基长度数值型正整数0N16染色体条带定位CytogeneticbandCytogcneticband基因所在染色体号及其氏短臂区域字符串型自由文本0N17物种名称OrganismOrganism标记物所来自的生物物种的名称,比如HomOsapiens字符串型自由文本MN18参考基因组Referencegenomeref生物标记物所对应的参考基因组,如hg38字符串型自由文本MN19临床表型名称ClinicalPhenotypeClinicalPheno生物标记物所对应的临床表型名称或ID(唯一)字符串型自由文本MN20临床
5、关联ClinicalRelevanceClinicalRelevance生物标记物的临床关联,包含了风险、诊断、预后和治疗等字符串型自由文本MN21实验验证ValidationValidation生物标记物是否经过了实验验证布尔型是或否MN22研究方法名称StudymethodStudymethod生物标记物与临床表型关联所用的方法,如GWAS字符串型自由文本MN23风险量值RiskRatioRR生物标记物对临床表型的风险效应值大小,基因组建议使用OR字符串型自由文本0N24统计P值PvalueP生物标记物与临床关联的统计学显著性程度,可以根据情况选用p-valuc.FDR,Boffcrron
6、i矫正数值型0-1C,统计学方法必选NA.2表观(甲基化)组序号中文名称英文名称缩写词定义数据类型值域约束/条件最大出现次数备注1染色体编号ChromosomeChromosome染色体编号字符串自由文本MN2起始位宜StartPositionStartPosition染色体上的起始位置数值型正整数MN3终止位置EndPositionEndPosition在染色体上的终止位置数值型正整数MN4正负链信息StrandStrand在染色体上的链信息字符串“或0N5甲基化类型MethylationTypeMethylationType甲基化类型字符串位点或区域MN6甲基化水平Methylation1
7、.evelMcthylation1.evel甲基化水平字符串超(去)甲基化0N7氏度1.ength1.ength长度数值型正整数MN8功能区域Genomics1.ocationGenomics1.ocation所在的功能区域信息,不同功能区域标注信息具体为:exon,intron.UTRpromoter等字符串自由文本0N9基因名称GeneNameGeneName基因symbol名称字符串自由文本MN10基因IDGeneIDGeneID用于唯一标识基因的数字,如EntreZGeneID数值型正整数MN11临床表型名称ClinicalPhenotypeClinicalPheno生物标记物所对应的
8、临床表型名称或ID(唯一)字符串自由文本MN12临床关联ClinicalRelevanceClinicalRelevance生物标记物的临床关联,包含了风险、诊断、预后和治疗等。字符串自由文本MN13实验验证ValidationValidation生物标记物是否经过了实验验证布尔型是或否MN14研究方法名称StudymethodStudymethod生物标记物与临床表型关联所用的方法,如eWAS、差异比较等。字符串自由文本MN15风险量值RiskRatioRR生物标记物对临床表型的风险效应值大小,甲基化建议使用差异程度字符串自由文本0N16统计P值PvalueP生物标记物与临床关联的统计学显著
9、性程度,可以根据情况选用PValue,FDR,Bofferroni矫正数值型0-1C,统计学方法必选NA.3转录组序号中文名称英文名称缩写词定义数据类型值域约束/条件最大出现次数备注1基因名称GencNameGoneName标记物位置的基因名称(使用GCneSymbol)字符串型自由文本MN2基因类型GenetypeGenetype生物标记物的类型,包含mRNA、miRNA、CirCRNA、InCRNA等字符串型自由文本MN3基因IDGeneIDGeneID用于唯一标识基因的数字,如EntrCZGenCID数值型正整数MN4基因全称GenefullnameGeneFN基因全称,如MToR全称为
10、MeChaniStiCTargetOfRapamycinKinase字符串型自由文本0N5正负链信息StrandStrand基因在染色体上的链向信息,分为正链(+)和负链(一)两种字符串型或“MN6靶标基因targetgenetargetgeneticroRNA或IncRNA靶标基因字符串型自由文本C,当RNA类型为miRN和IncRNA时必选N7参考基因组Referencegenomeref生物标记物所对应的参考基因组,如hg38字符串型自由文本MN8物种OrganismOrganism标记物所来自的生物物种的名称,比如Iischerichiacoli字符串型自由文本MN9细胞类型CellT
11、ypeCellType标记物所来自的细胞类型字符串型自由文本C,当RNA类型为单细胞转录测序时N10临床表型名称ClinicalPhenotypeClinicalPhenotype生物标记物所对应的临床表型名称或ID(唯一)字符串型自由文本MN11研究方法名称StudymethodStudymethod生物标记物与临床表型关联所用的方法,如TWAS或弟异比较字符串型自由文本MN12风险量值RiskRatioRR生物标记物对临床表型的风险效应值大小,转录组建议使用差异倍数IogSFoldChange字符串型自由文本0N13统计P值PvalueP生物标记物与临床关联的统计学显著性程度,可以根据情况
12、选用P-value,FDR,Bofferroni矫正数值型0-1C,统计学方法必选N14临床关联ClinicalRelevanceClinicalRelevance生物标记物的临床关联,包含了风险、诊断、预后和治疗等字符串型自由文本MN15实验验证ValidationValidation生物标记物是否经过了实验验证布尔型是或否MNA.4蛋白质组序号中文名称英文名称缩写词定义数据类型值域约束/条件最大出现次数备注1蛋白质标识符ProteinIdentifierproteinidentifier每个蛋白质的唯一标识符,如UniProtID字符串自由文本MN2蛋白质名称ProteinNameProteinName蛋白质的通用名称字符串自由文本MN3基因名称GeneNameGeneName基因symbol名称字符串自由文本MN4基因IDGen