《计算机视觉概述.ppt》由会员分享,可在线阅读,更多相关《计算机视觉概述.ppt(49页珍藏版)》请在第壹文秘上搜索。
1、计算机视觉计算机视觉 Computer VisionInt. Conf. on Computer Vision and Pattern Recognition (CVPR); Int. Conf. on Computer Vision(ICCV); Int. Conf. on Pattern Recognition(ICPR); European Conf. on Computer Vision(ECCV); Asian Conf. on Computer Vision(ACCV); IEEE Trans. on Pattern Analysis and Machine Intelligenc
2、e(PAMI); Int. J on Computer Vision(IJCV); Image and Vision Computing; Pattern Recognition Letter;Pattern Recognition; IEEE Trans. on Image Processing.用于生产线上具有简单视觉系统的工业机器人系统用于生产线上具有简单视觉系统的工业机器人系统人头部跟踪人头部跟踪由移动机器人立体视觉系统获取的立体图像对,可用来重建场景三维信息由移动机器人立体视觉系统获取的立体图像对,可用来重建场景三维信息 勇气号火星车Rocky 7 火星车MIT Media Lab
3、,与虚拟生物交互的虚拟系统,与虚拟生物交互的虚拟系统1)输入设备输入设备(input device) 包括成像设备和数字化设备。成包括成像设备和数字化设备。成象设备是指通过光学摄像机或红外、激光、超声、象设备是指通过光学摄像机或红外、激光、超声、X X射线射线对周围场景或物体进行探测成象,得到关于场景或物体对周围场景或物体进行探测成象,得到关于场景或物体的二维或三维数字化图像。的二维或三维数字化图像。2)低层视觉低层视觉(low level) 主要是对输入的原始图像进行处理主要是对输入的原始图像进行处理。这一过程借用了大量的图像处理技术和算法,如图像。这一过程借用了大量的图像处理技术和算法,如
4、图像滤波、图像增强、边缘检测、纹理检测、运动检测,以滤波、图像增强、边缘检测、纹理检测、运动检测,以便从图像中抽取诸如角点、边缘、线条、边界、色彩、便从图像中抽取诸如角点、边缘、线条、边界、色彩、纹理、运动等关于场景的基本特征。纹理、运动等关于场景的基本特征。3)中层视觉(中层视觉(middle level) 主要任务是恢复场景的深度主要任务是恢复场景的深度、表面法线方向、轮廓等有关场景的、表面法线方向、轮廓等有关场景的2.5维信息,实现的维信息,实现的途径有立体视觉(途径有立体视觉(stereo vision)、测距成像()、测距成像(rangefinder)、从)、从X恢复形状(恢复形状(
5、Shape from X, X = 明暗明暗、纹理、运动)系统标定、系统成像模型等研究内容、纹理、运动)系统标定、系统成像模型等研究内容一般也是在这个层次上进行的。一般也是在这个层次上进行的。4)高层视觉(高层视觉(high level) 主要任务是在以物体为中心的主要任务是在以物体为中心的坐标系中,在原始输入图像、图像基本特征、坐标系中,在原始输入图像、图像基本特征、2.5维图的维图的基础上,恢复物体的完整三维图,建立物体三维描述,基础上,恢复物体的完整三维图,建立物体三维描述,识别三维物体并确定物体的位置和方向。识别三维物体并确定物体的位置和方向。5)体系结构(体系结构(system ar
6、chitecture) 在高度抽象的层次上在高度抽象的层次上,根据系统模型而不是根据实现设计的具体例子来研究,根据系统模型而不是根据实现设计的具体例子来研究系统的结构。体系结构研究涉及一系列相关的课题:并系统的结构。体系结构研究涉及一系列相关的课题:并行结构、分层结构、信息流结构、拓扑结构以及从设计行结构、分层结构、信息流结构、拓扑结构以及从设计到实现的途径等等。到实现的途径等等。1)图像处理图像处理 (image processing) 图像处理通常是把图像处理通常是把一幅图像变换成另一幅图像变换成另外一幅图像外一幅图像;计算机视觉系统把;计算机视觉系统把图像作为输入,产生的输出为另一种形图
7、像作为输入,产生的输出为另一种形式式。图像处理在机器视觉系统。图像处理在机器视觉系统早期阶段起着很大的作用早期阶段起着很大的作用。2)计算机图形学计算机图形学 (computer graphics) 通过几何基元,如线、圆和自由通过几何基元,如线、圆和自由曲面等,来生成图像,属于曲面等,来生成图像,属于图像综合图像综合;计算机视觉正好是解决相反的问;计算机视觉正好是解决相反的问题,即从图像中估计几何基元和其它特征,属于题,即从图像中估计几何基元和其它特征,属于图像分析图像分析。可视化和虚。可视化和虚拟现实把两个领域拟现实把两个领域紧密地联系在一起紧密地联系在一起。3)模式识别模式识别 (pat
8、tern recognition) 研究研究分类问题分类问题,确定符号、图画、,确定符号、图画、物体等输入对象的类别。强调一类事物物体等输入对象的类别。强调一类事物区别区别于其它事物所具有的于其它事物所具有的共同特共同特征征。一般不关心三维世界的恢复问题。模式识别方法是计算机视觉识别。一般不关心三维世界的恢复问题。模式识别方法是计算机视觉识别物体的物体的重要基础之一重要基础之一。3)人工智能人工智能 (Artificial Intelligence) 涉及到涉及到智能系统的设计和智能计智能系统的设计和智能计算的研究。算的研究。计算机视觉在经过图像处理和图像特征提取过程后,接下来计算机视觉在经过
9、图像处理和图像特征提取过程后,接下来要用人工智能方法对要用人工智能方法对场景特征进行表示,并分析和理解场景场景特征进行表示,并分析和理解场景。计算机视。计算机视觉被视为人工智能的觉被视为人工智能的一个分支一个分支。4)人工神经网络人工神经网络 (Arificial Neural Networks) 一种一种信息处理系统信息处理系统,它是,它是由大量简单的处理单元通过具有强度的连接相互联系起来,实现并行分由大量简单的处理单元通过具有强度的连接相互联系起来,实现并行分布式处理。可以实现类似人的布式处理。可以实现类似人的学习学习、归纳和分类等功能归纳和分类等功能。作为一种方法。作为一种方法和机制将用
10、于和机制将用于解决计算机视觉中许多问题解决计算机视觉中许多问题。5)认知科学与神经科学认知科学与神经科学 (Cognitive science and Neuroscience) 将将人类人类视觉视觉作为主要的研究对象。计算机视觉中已有的许多方法与人类视觉作为主要的研究对象。计算机视觉中已有的许多方法与人类视觉极极为相似为相似。许多计算机视觉研究者对研究人类视觉计算模型比研究计算机。许多计算机视觉研究者对研究人类视觉计算模型比研究计算机视觉系统更感兴趣,希望计算机视觉视觉系统更感兴趣,希望计算机视觉更加自然化,更加接近生物视觉更加自然化,更加接近生物视觉。不同形状的三维物体投影在图像平面上产生相同图像不同形状的三维物体投影在图像平面上产生相同图像 中间图像既与左边中间图像既与左边图像相似,又与右边图像相似图像相似,又与右边图像相似 几个立方体构成的多义性图像几个立方体构成的多义性图像