《信息检索与利用.docx》由会员分享,可在线阅读,更多相关《信息检索与利用.docx(5页珍藏版)》请在第壹文秘上搜索。
1、信息检索与采用复习资料孙思琴老师强调的重点记忆内容第一章1 .信息(information),是事物存在方式、运动状态及其特征的反映,识事物发出的信号、信息02 .信息的特征:.共享性存储性传递性价值性时效性客观性3 .信息的来源:文献信息:用文字、符号、数据、图像、声频、视频等纪录在载体上的信息。非文献信息:包括口头信息、体语信息、实物信息。4 .学问(knowledge),是对事物本身的熟悉,是优化、理论化了的信息集合。5 .信息素养包括:信息意识信息力量信息道德6 .文献的定义:文献是纪录有学问的一切载体。7 .文献的四个基本要素:学问载体文字、图像、符号、音频、标识符号等有形的学问信息
2、纪录8 .信息、学问、文献三者之间的关系:信息是原料;学问是核心;文献是载体。9.文献按加工程度划分为:零次文献:指未公开出版的试验纪录、原始录音、书信、手稿、口头沟通的信息或事物。一次文献:作者直接以自己的工作、科研、社会活动等实践阅历为依据而撰写的文献,也常被成为原始文献。例如:期刊论文、专蓍、科技报告、学位论文、支和说明书等。二次文献:是依据一次文献外表或内容特征,依据肯定规章和方法进行加工、整理、浓缩、按肯定挨次编排形成的有序化文献。例如:名目、索引、文摘、题录。三次文献:是为了肯定的目的与要求,对大量的一次文献信息中的有关内容进行综合、分析、提炼、重新组合而成的再生性文献。例如:综述
3、、手册、年鉴、百科全书、词典、大全、文献、指南。10:文献的半生期:某学科现时尚在采用的全部文献中的一半,是在多长时间内发表的。生物学文献的半生期为3年。11.信息检索的定义:是采用肯定的检索工具,以科学的方法,从众多的文献中找出特定的需要信息的过程。依据检索对象和检索内容的不同,信息检索可分为文献检索、事实检索和数据检索三种。其次章1 .检索语言是人工语言。2 .检索语言的分类:表达文献外部特征的检索语言。主要是以文献信息上标明的、显而易见的外部特征。例如:文献题目、著者姓名、机构名称、出版者、文献号、文献出处等。表达文献内容特征的检索语言:包括分类语言和主题语言。3 .分类语言是按文献的学
4、科性质给与相应的分类号,用分类号来表达文献的主题概念,依据分类表中的挨次编排成分类索引供应分类途径供检索文献使用。能获得较高的杳全率,但专指性较差,不适合专深主题和多位概念的检索。4 .中国图书馆分类法简称中图法。中图法又五个基本部类,盆个基本大类。五个基本部类分别是马克思主义、列宁主义、毛泽东思想、邓小平理论哲学、宗教社会科学自然科学综合性图书(医药卫生属于包然科学R一类5 .信息检索工具的特点:信息密集编排有序以查考为主6 .信息检索途径:分类途径:是依据文献内容所属的学科类别来检索文献的途径。查金率高,但查准率低。主题途径:是通过反映文献内容主题的语词来检索文献的途径。专指性强,熊集中反
5、映同一主题而分散在不同学科中的文献,瓷准率高,但不能集中于同一学科、专业或类族事物的文献。关键词途径著者途径题名途径号码途径7 .信息检索的基本要求:全面精确快速8.查全率=检出的相关文献量/文献库中相关文献总量Xlo0%查准率=检准的相关文献量/检出的全部文献量XI(X)%上两式中的分子是一样的。查全率与查准率是互逆的关系。查全率+漏检率=I查准率+误检率=1第三章1 .计算机信息检索一般由硬件、软件及数据库三部分组成。2 .数据库的类型:书目数据库(BibIiOgraPhiCdatabase)包括名目、题录、文摘等书目线索。CBMdiSC和PUbMCd都是书目数据库Q事实数据库(FaCtd
6、atabase)数值数据库(Numericdatabase)全文数据库(FUIItextdatabase)中国知网为全文数据库。3 .Internet运行与管理方式有三种:局域网、区域网、主干网。4 .综合性搜寻引擎:又称为“通用搜寻引擎。如Google、百度、Yahoo.北大天网。5.布尔规律检索:三个基本运算符是:0R(+)、AND(*)、NOT(一).规律或:运算符为“OR”或“+”,表并列。能扩大检索范围,提高查全率。规律与:运算符为“AND”或“*”,表相交。能缩小检索范围,提高查准率。规律非:运算符为“NOT”或“-”,表不包含或排解。能缩小检索范围,提高查准率。布尔规律运算挨次:
7、NoTADOR,但可以用()来转变运算次序。6.截词(truncation)检索:是将检索词在合适的地方截断,取其中的片段再加上截词符号一起输入检索系统,计算机依据词的片段与数据库里的索引词进行比较匹配,凡包含这个检索片段的字符的文献,都未命中文献。7.常用的截词符有:CBMdiSC的截词符为任意通配符(*)和单字通配符(?)。PubMed的截词符为(*)。中国知网的截词符为()。8.截词方法分为前截断、中截断、后截断和复合截断四种类型。前截断又称左截断。例如:检索式*physics后截断又称右截断。例如:computer*中截断,例如:WOni?n复合截断,例如:Vchemi?截词检索可以起
8、到扩大检索范围,提高查全率,削减检索词的输入量,节约检索时间,降低检索费用等作用。第四章1 .中国生物医学文献数据库(ChineseBiologicalMedicalLiteratureDatabaseonDisc,简称CBMdiSC)2 .CBMdiSC共有38个字段和三个组合字段。AB文摘AD地址(第一著者地址)AU著者CT特征词MH主题词PT文献类型(指综述、论文、译文)PY出版年SO出处TA期刊名称Tl中文题目 3.CBMdiSC的规律运算符:ANDORANDNOT优先运算:()ANDN0TAND0R 4.字段限制符:In:对某一字段进行模糊检索。=:对某一字段进行精确检索。作者、杂志
9、名用“=”。 5。截词符单字通配符(?)和任意通配符(*)第五章1.医学主题词表(MedicalSubjectHeadingS,简称MeSH),目前MeSH使用的主题词1800个,副主题词(Subheading)83个。2 .字顺表(Alphabeticlist)简称MeSHAI表。3 .MeSH词组为顺置型词组,若词组之间加了为倒置型词组。4.PubMcd检索系统的网址为:或bmcd5. 其中ncbi是美国我国生物技术信息中心。nbn是美国国立医学图书馆.nih是美国国立健康讨论所。6. 1.imits为限定检索,AdVanCCd为高级检索,DCtaiIS为检索细节。HiStory为检索历史
10、。PubMed的History中最多可保留100个检索式,超过100个会自动删除最早的检索式。最多保留8小时。粘贴板(CliPbOard)中最多能存放500个检索式,有效时间也为8小时。7. PubMcd的词汇自动转换功能(AutomaticTermMapping)对于输入检索框中非限定的检索词,系统将采用词汇自动转换功能,按挨次一次对MCSH转换表、刊名转换表、短语表、著者索引逐一对比、核对、匹配转换成相应词进行检索。8. PubMed的检索表达式的格式为:检索词字段标识布尔运算符检索词字段标识,9. PubMcd的截词符为“*”,截词功能只限于单词,对词组无效。使用截词功能时,PubMcd
11、系统会自动关闭词汇转换功能。10. PUbMed使用双引号(“”)进行强制检索,刊名和作者检索时用11. PubMed的日期范围检索中间用“:”隔开,CBMdiSC的日期范围检索中间用“-”。例如:检索2000年至今的文献。PubMed中为2000:2022DP,CBMdisc中为PY=2000-2022。12. PUbMCd的字段标示符及意义:ABAbstract文摘ADAffliation著者地址AUAuthor著者姓名EDATEntrezDate录入时间TAJournalTitle期刊名或ISSN号LALanguage文献语种MAJR!MeSHMajorTopic主要McSH主题词MHM
12、eSHTerms全部MeSH主题词DPTLPublicationDate文献出版日期Title论文题名PTPublicationType文献类型第六章1.全文数据库的特点:全文数据库的最大特点就是直接能阅读原文,不必再为猎取原文而奔波。多数全文数据库供应有“全文”字段检索,采用这一字段检索更利于文献的查全。全文扫瞄器功能齐全,有文献全文下载、免制、E-InaiI输出、字体放大、缩小等功能。有的全文数据库收录的某些文献不如题录、摘要型数据库全。单位用户有并发用户数和超时限制。其中前三点为优点,后两点为缺点。2.AcrobatRCadCr是应用最普遍的全文扫瞄器。它是adobe公司推出的一个查看、
13、阅读、和打印PDF文件的最佳工具。3.中国学问基础设施工程(ChinaNationalKnowledgeInfraStrUCtUre简称CNKl)即中国知网。此工程于1999年6月开通。CNKl中心网站网址为:WWW4 .中国期刊全文数据库按文献内容分为士大专辑,各专辑分为若干专题,共168个专题。5 .CNKI针对用户的不同条件,推出不同的服务方式,对网络条件好、使用频率高的机构,采纳“网上包库”;对硬件条件较好、有内部局域网的机构采纳建立“镜像站”等。CNKl系列数据库可进行单库检索,也可以多库同时检索,即跨库检索。6 .CNKI检索题录或文摘是免费的,假如要扫瞄文献全文则需要交费。PUb
14、MCd有5%的全文免费阅读功能。7 .检索途径的选择:是采用不同的检索途径(检索项),检索结果不同,检索时可依据需要选择,同时留意多中检索途径的协作使用,以便提高查全率和查准率。一般检索途径有:关键词(最常用)、篇名、摘要、全文、分类、作者、刊名等。第十章1 .循证医学(Evidence-basedMedicine,EBM)又称求证医学,意为遵循证据的临床医学,即临床决策需建立在当前最佳科学证据基础上。2 .循证医学证据:临床试验(ClinicalTrials)对比临床试验(ControlledClinicalTrials)随机对比试验(RandonliZCdControlledtrials,
15、RCT)系统评价(SyStenIatiCReview,SR)Meta-分析(Meta-analysis)实践指南(PracticeGuideline)3 .循证医学分级:一级:依据特定病种的特定疗法收集全部质量牢靠的随机对比试验(RCT)后所作的系统评价或Meta-分析(牢靠性高,可作为金标准);二级:单个的样本量足够的随机对比试验结果(有较高的牢靠性,建议采纳);三级:设有对比组但未用随机方法分组的讨论(有肯定的牢靠性,可以采纳);四级:无对比的系列病例观看(牢靠性较差,可供参考);五级:个案报道和专家意见(非前瞻性、非随机、无对比)(牢靠性最差,仅供参考)。4 .循证医学资源中心(TheCochraneLibrary)网址为:它是Cochrane协作网系统综述资料库。其他考点1 .英文医学专业搜寻引擎:MedicalMatrix(医源,)2 .中国高等教育文献保障系统(ChinaAcademicLibrary&In