《第七讲认知智能.docx》由会员分享,可在线阅读,更多相关《第七讲认知智能.docx(5页珍藏版)》请在第壹文秘上搜索。
1、第七讲认知智能教学内容:本章主要学习认知智能基本原理,包括逻辑推理、知识表示、搜索技术、知识图谱、认知计算等内容。教学重点:知识表示、知识图谱。教学难点:知识图谱技术。教学方法:课堂教学为主,结合智慧树等在线平台实时提问、收集学生学习情况,充分利用网络课程中的多媒体素材来表示认知智能技术的实现原理和过程。讨论五分钟。课后布置作业,要求学生查找、阅读与知识图谱有关的经典论文等。学习慕课第七章认知智能并完成章节测试。教学要求:重点掌握命题与推理概念、演绎推理、归纳推理、谓词表示法、语义网络表示法、启发式搜索技术、知识图谱技术。课程思政内容:本章无相关内容。学习目标:1 .理解和掌握认知智能基本概念
2、,机器认知智能与人类认知智能的区别和联系。2 .学习和理解实现机器认知的基本方法,包括逻辑推理、知识表示、本体、知识图谱等。3 .学习和理解经典的搜索技术,了解特卡罗模拟的博弈树搜索算法;4 .学习和理解认知智能的实际发展和应用现状。学习导言认知智能即对人类深思熟虑的行为的模拟,包括记忆、常识、知识学习、推理、规划、决策、意图、动机与思考等高级智能行为,机器认知智能不是单纯的利用计算机模拟人类的认知智能,恰如飞机模拟鸟儿飞行但不必完全模拟鸟儿的生物学特征一样,机器认知智能可以在功能上表现得人类类似甚至超越人类智能。现阶段人工智能以机器感知智能为主,但已开始迈入从感知智者到认知智能的变迁阶段。机
3、器虽然可以通过传感器获得对外界的感知,具备一定的感知智能,但机器并不具备理性认识能力,即通过逻辑推理有意识地理解和思考世界的能力。深度学习在认知方面的缺陷使研究人员重新考虑传统认知学派的价值,将推理、逻辑等符号主义方法与现代机器学习方法相结合,提升机器的认知智能水平。人们希望在浅层次的感知智能和初级符号处理认知智能的基础上,发展出能够在一定情况和环境下进行思考、理解、反馈、适应的深层次、交互式、高级认知智能。目前,在深度学习的推动下,机器感知能力显著提升,但人工智能在机器认知智能方面还远没有突破。让机器具备感知能力只是让机器具备了一般动物所具备的能力,但认知能力是人类独有的能力。认知智能是比感
4、知智能更先进的人工智能,相较于感知能力,认知能力的实现难度更大,价值也更大。机器认知智能的核心在于机器的辨识、思考以及主动学习。一旦机器具备认知能力,人工智能技术将会给人类社会带来颠覆性革命,同时也将释放出巨大的产业能量。所以实现机器的认知能力是人工智能发展进程中具有里程碑意义的重大事件。传统的符号主义人工智能可以概括为符号表达、逻辑推理、启发式编程,或者称之为对“深思熟虑”的思维的模拟,这些人工智能方法实际就是实现初级机器认知智能的方法。符号主义方法是实现初级认知智能的基本方法,在此基础上发展出了知识图谱、认知计算等新型认知智能技术,尽管这些理论和技术都没有使机器实现类人的高级认知智能,但有
5、助于形成机器自身的、独特的、不同于人类的认知智能。本章主要学习认知智能的经典理论与方法以及新发展的知识图谱等认知智能技术。研究人员己经在开发深度学习结合贝叶斯网络、逻辑推理等方法的认知智能技术,类似IBM沃森超级计算机的、基于深层关系发现与推理能力的认知计算模式将在未来占据主流地位,取代单纯的感知智能。7.1 逻辑推理1命题与推理逻辑推理论证广泛地渗透在人们的认知思维活动之中。逻辑学是研究人类内在逻辑推理能力的学科,其中数理逻辑将人类逻辑推理形式化,使得人们可以借助计算机模拟人类的逻辑推理过程,这就是初级的机器认知智能的基本原理。在逻辑学中,描述逻辑推理一个基本概念是命题。命题是描述事件的语句
6、,只有陈述句表达命题,一个推理是一个陈述句的集合。对命题内容的判断分为真、假两种。一个命题所描述的如果符合事实,它就是真的,如果不符合事实,它就是假的。无所谓真假的语句不表达命题。2推理的类型从不同角度看推理,类型很多。比如,按照推理的逻辑基础分类,可分为演绎推理、归纳推理和默认推理;按推理时所用知识的确定性来划分,推理可分为确定性推理、不确定性推理;按照推理过程中所推出的结论是否单调地增加,或者说按照推理过程所得到的结论是否越来越接近最终目标来分类,推理可分为单调推理与非单调推理。所谓类比推理是指在两个或两类事物有许多属性都相同或相似的基础上,推出他们在其他属性上也相同或相似的一种归纳推理。
7、例如,设4、8分别是两类事物的集合A=8=的也,并且S与瓦总是成对出现,且当有属性尸时,&就有属性。与之对应,即:P(0)QSj)i=l,2,.”.则当A与8中有一新的元素对(4)出现时,若已知有属性P,则可推理出Z/有属性Q,即P()QS%.7.2知识表示知识表示就是按照人类对概念分类、知识的定义以及对各种知识的归纳,并以一定的方式或规则表示成适合机器处理的数据结构;知识表示研究客观世界知识的建模,以方便机器识别和理解,既要考虑知识的表示与存储,又要考虑知识的使用和计算,是人工智能的基本问题和重要研究内容。知识表示技术可以分成符号主义和联结主义:符号主义的基础是纽厄尔和西蒙提出的物理符号系统
8、假设,认为人类认知和思维的基本单元是符号,而认知过程就是在符号表示上的运算;联结主义认为,人的认知就是相互联系的具有一定活性值的神经单元所形成网络的整体活动,知识信息不存在于特定的点,而是在神经网络的联结或者权值中。一般的知识表示有以下几种方法:谓词逻辑法、产生式表示法、状态空间表示法、框架表示法、语义网络法、脚本表示法以及本体。1)谓词逻辑法谓词逻辑表示法是指各种基于形式逻辑的知识表示方式,适合于表示事物的状态、属性、概念等事实性知识,也可以用来表示事物间具有确定因果关系的规则性知识。它是人工智能领域中使用最早和最广泛的知识表示方法之一。谓词公式谓词符号尸中包含的个体数目为,则称P.为.元谓
9、词符号。例如:father。,.)是一元函数,less(%,y)是二元谓词。如果谓词P.中的所有个体都是个体常量、变元、或函数,则该谓词为一阶谓词。如果谓词产中某个个体本身又是一个一阶谓词,则称P为二阶谓词。一般一元谓词表达了个体的性质,而多元谓词表达了个体之间的关系。例如:“张三是一名计算机系的学生,他喜欢编程序。”可以表示为COmPUter(张三)Like(张三,programming)其中,Computer(x)表示X是计算机系的学生,Like(x,y.)表示X喜欢y,对规则性知识,通常使用由蕴涵符号连接起来的谓词公式来表示。2语义网络表示法语义网络是一种通过概念及其语义联系(或语义关系
10、)来表示知识的有向图,节点和弧必须带有标注。其中有向图的各节点用来表示各种事物、概念、情况、属性、状态、事件和动作等,节点上的标注用来区分各节点所表示的不同对象,每个各节点可以带有多个属性,以表征其所代表的对象的特性。例如:”生物的分类”,可以表示为图中所示的语义网络。图7.4AKO联系实例通过AKO将生物分类问题领域中的所有类结点组成一个AKO层次网络,给出了生物分类系统中的部分概念类型之间的AKO联系描述。7.3搜索技术1、启发式搜索盲目搜索不仅效率低,而且耗费过多的计算空间与时间。人们试图找到一种方法用于排列待扩展节点的顺序,即选择最有希望的节点加以扩展,那么搜索效率将会大为提高。启发式
11、搜索在搜索过程中加入了与问题有关的启发性信息,用于指导搜索朝着最有希望的节点作为下一个被扩展的节点,因此这种搜索叫做有序搜索。有序搜索又称为最好优先搜索,它总是选择最有希望的节点作为下一个要扩展的节点。八数码难题该问题是一个经典搜索问题,如图7.9,将处于随机初始状态的8个数字按照一定步骤移动为从1到8的顺序位置。11l23765图7.9八数码难题解:采用估价函数5)=g5)+M),其中g()是搜索树中节点的深度,/?()用来计算对应于节点的数据库中错放的棋子个数。如图7.9,八数码数据库左侧的数字是放错的棋子个数,因此起始节点处的/=0+3=3。由起始节点SD到目标节点为每次搜索都会选择一条
12、最小路径代价向下搜索。2、蒙特卡罗树搜索算法从2006年开始,计算机围棋博弈的相关研究有了跨越式的发展,基于蒙特卡罗模拟的博弈树搜索算法获得了重要的成功,尤其是在围棋程序AlPhaGO中的应用,更凸显了其在实现机器认知智能中不可或缺的作用。AlphaGo在蒙特卡洛树搜索的框架下,利用深度学习和强化学习技术进行训练和评估,其中用到了人类棋手以往的16万盘棋谱,以及AlphaGo自己左右互搏产生的3000万盘棋谱,并用到了人类总结的几万个模式,综合运用这些技术,实现了高水平的围棋程序,并于2016年3月以4:1的成绩战胜了韩国围棋职业高手李世石。这些技术并不是新技术,但是创新主要包括两个方面,一个
13、是发展了强化学习技术;二是将传统的搜索技术与深度学习在围棋这个平台上,很好地结合在一起,实现了理性与感性的良好融合。7.3知识图谱知识图谱旨在描述客观世界的概念、实体、事件及其间的关系。概念就是指人们在认识世界过程中形成的对客观事物的概念化表示,如人、动物、组织机构等;实体是客观世界中的具体事物;事件是客观世界的活动,如地震、买卖行为等。知识图谱实现机器认知智能的两个核心能力:“理解”和“解释”。机器理解数据的本质是建立起从数据到知识库中的知识要素(包括实体、概念和关系)映射的一个过程。比如如果说到“2013年的金球奖得主C罗”这句话,之所以说自己理解了这句话,是因为我们把“C罗”这个词汇关联
14、到脑子中的实体“C罗”,把“金球奖”这个词汇映射到脑中的实体“金球奖”,然后把“得主”一词映射到边“获得奖项”这个关系,如图7.16。文本理解过程其本质是建立从数据,包括文本、图片、语音、视频等数据到知识库中的实体、概念、属性映射的过程。人类是如何“解释”的。比如问“C罗为什么最受球迷关注?”,可以通过知识库中的“C罗获得奖项金球奖”以及“金球奖地位影响力最大的足球奖项之一”这两条关系来解释这一问题。这一过程的本质就是将知识库中的知识与问题或者数据加以关联的过程。有了知识图谱,机器完全可以重现人的这种理解与解释过程。实体、概念、关系之间的示例如图所示,如果两个节点之间存在关系,用一条无向边连接
15、在一起,那么这个节点就称为实体(Entity),它们之间的边称为关系(ReEionShiP)O实体/概念知识图谱的基本单位,就是“实体(Entity)-关系(ReIatiOnShiP)-实体(Entity)”构成的三元组,这就是知识图谱技术的核心。知识图谱的原始数据类型一般来说包括结构化数据、半结构化、非结构化数据三类。大多数知识图谱用资源描述框架(ReSoUrCeDeSCriPtiOnFramework,RDF)表示实体和实体的关系,这种关系有两种:种是属性关系,即个实体是另一个实体的属性;另一种是外部关系,表明两个实体之间存在外部关联。RDF形式上表示为主题预测目标(SubjectPredicateObject,SPO)三元组,所以实体通过关系链接成无向的网络。